清华新闻网5月30日电 在当下全球人类健康研究前沿领域,代谢组学正在成为推动精准医疗发展的关键性工具——通过核磁共振(NMR)等高通量检测技术,科学家们得以纵观全局,快速、深入地解析人体代谢状态与疾病之间的复杂关联。然而,面对高维复杂的代谢组数据,如何准确识别个体间的代谢差异,仍然是当前生物信息学领域亟待突破的攻坚难题。
目前已知的代谢数据分析方法,往往难以有效捕捉数据中潜在的非线性结构和隐含分层的特征,这在一定程度上限制了我们对于个体代谢状态与疾病风险关系的深入理解和研究。特别是在识别特定亚群体、阐释代谢异质性对慢性疾病风险影响机制方面,传统分析手段仍存在明显局限性,有待进一步优化。
为解决这些关键问题,清华大学丘成桐数学科学中心丘成桐团队和新加坡国立大学统计与数据科学系姚志刚团队开展长期深度合作,创新性地提出了基于流形拟合的代谢分析框架(如图所示)。该研究将251种源自英国生物银行(UK Biobank)的NMR代谢生物标志物系统划分为七个功能类别,这些类别反映了人体代谢的模块化结构特征,并对每一类别分别进行流形拟合。通过这一创新流程,研究团队成功在高维数据空间中识别出潜在的底层低维结构,在有效降低数据噪声干扰的基础上,完整保留了关键的生物学信息。这种基于几何原理的建模方法,将复杂的代谢数据转化为更具解释性的模型,从而在群体层面上快速精准地识别出具有明确疾病风险特征的亚人群。
基于流形拟合的代谢组分析流程图
该方法首先将251个代谢标志物划分为七大类,随后对每一类分别进行流形拟合,提取关键结构,最后进行个体分群和疾病关联分析。
研究结果显示,在七个功能类别中,有三个类别的流形结构能够将研究人群清晰划分为两个代谢特征显著不同的亚群体。而这些亚群不仅在代谢特征上表现出系统性差异,更是被证明与代谢综合征、心血管疾病和自身免疫性疾病等多种疾病风险显著相关。相比传统分析方法,该框架在保留生物学信号、发现疾病相关亚群,以及与人口统计学和生活方式变量的关联一致性等方面均表现更优。这项研究不仅为全面理解人体代谢状态提供了全新的几何切入视角,也为代谢组学研究和人群健康管理开辟了创新研究方向。
相关研究成果以“多元拟合揭示了英国生物库人群的代谢组学异质性和疾病关联”(Manifold Fitting Reveals Metabolomic Heterogeneity and Disease Associations in UK Biobank Populations)为题,于5月28日发表于《美国国家科学院院刊》(Proceedings of the National Academy of Sciences of the United States of America,PNAS)。
新加坡国立大学博士后研究员李冰杰、苏佳骥以及博士生蔺润宇为论文第一作者,清华大学丘成桐数学科学中心教授丘成桐与新加坡国立大学副教授姚志刚为论文通讯作者。研究得到新加坡教育部研究基金和清华大学丘成桐数学科学中心的支持。
本文链接:http://knowith.com/news-3-2710.html丘成桐团队合作推出基于流形拟合的代谢分析框架 精准识别疾病风险亚群
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。