文献检索文档翻译深度研究

Suppr Zotero 插件Zotero 插件
邀请有礼套餐&价格历史记录
Suppr
超能文献

Nature重磅:50万汉族基因组填补空白,定制化预测东方人疾病风险

学术资讯
2025/12/10 17:33:41
  1. 首页
  2. 学术前沿资讯
  3. Nature重磅:50万汉族基因组填补空白,定制化预测东方人疾病风险

Nature重磅:50万汉族基因组填补空白,定制化预测东方人疾病风险

想象一下,你去做了一次昂贵的基因检测,希望能未雨绸缪地管理健康,结果报告却告诉你:预测结果主要参考的是欧洲人的遗传数据。这听起来是否有些“水土不服”?

这并非危言耸听,而是当前精准医疗面临的最大窘境。尽管现代遗传学承诺能根据个人基因图谱预测疾病风险,从而实现早期预防和个性化治疗,但现实是残酷的:绝大多数全基因组关联分析(GWAS)都聚焦于欧洲裔人群。这种全球范围内的“数据偏科”,使得非欧洲族群在享受前沿科技红利时,不得不面临预测准确度大打折扣的风险。

然而,一项近期发表于顶刊《Nature》的重磅研究正在打破这一格局。来自台湾精准医疗计划(TPMI)的研究团队,通过分析超过50万名汉族人的基因组与医疗数据,构建了全球最大的非欧洲裔人群队列之一。这项研究不仅填补了东亚人群在基因组学上的巨大空白,更开发出了一套真正“懂”东方人遗传体质的疾病预测模型。

1. 打破“白人数据”垄断:50万汉族人的遗传拼图

要搞清楚基因如何影响中国人的健康,首先得有足够大的样本量。过去的东亚生物样本库往往受限于几万到二十万的样本规模,或者仅关注特定疾病,难以与拥有数十万甚至百万级参与者的欧洲生物样本库(如UK Biobank)抗衡。而样本量的不足,直接限制了科学家发现那些在东亚人群中特有、但在欧洲人群中罕见的致病基因。

TPMI项目在2019年至2023年间,从台湾16个医疗中心招募了超过50万名参与者,不仅采集了DNA样本,还关联了这些参与者详尽的纵向电子病历(EMR)。这种“基因+病历”的深度结合,使得研究人员能够对广泛的疾病表型进行地毯式搜索。

如图[1]所示,研究团队对数据的代表性进行了严格验证。图a展示了TPMI队列中各类疾病(如循环系统、内分泌代谢、肿瘤等)的病例比例与台湾全民健康保险研究数据库(NHIRD)中5年患病率的对比。我们可以清晰地看到,散点主要分布在对角线附近,二者呈现出显著的正相关(r = 0.656),这意味着这50万人的健康状况能很好地代表汉族人群的整体疾病谱。同时,图b直观地列出了24种定量性状(如身高、血压、血脂、肝酶等)的样本量,其中大部分性状的样本数都超过了10万,甚至达到30万级别(如身高、BMI)。这种海量且高质量的数据积累,为挖掘汉族人特有的“遗传密码”提供了前所未有的统计效力。

Figure 1

Figure 1

2. 挖掘“隐藏”的风险:汉族特有的致病基因

拥有了针对性的大数据,研究团队立刻着手解决核心科学问题:究竟有哪些致病基因是汉族人特有,而在以往基于欧洲人的研究中被“漏掉”的?

通过对695种疾病和24种定量性状进行全基因组关联分析,研究人员不仅验证了大量已知的疾病位点,更重要的是,他们发现了95个全新的遗传关联信号。这些信号之所以在之前的研究中未被发现,很大程度上是因为它们属于“人群特异性”变异——即在汉族人群中并不罕见,但在欧洲人群中却极少存在,因此在以往以欧洲人为主的分析中被统计学“忽略”了。

为了直观地展示这些发现,我们可以参考图[2]。这张图描绘了全表型组范围内独立变异-性状关联的分布情况。图中上方展示了各类疾病(二分变量)的关联数量,下方则对应定量性状。每一个竖条代表一类疾病或性状,不同颜色区分了不同的疾病类别。可以明显看到,像内分泌/代谢疾病(草绿色)和循环系统疾病(粉色)拥有大量的遗传关联位点,且分布极不均匀。这种“全景式”的扫描,让我们第一次清晰地看到了汉族人群疾病遗传架构的独特性。

Figure 2

Figure 2

2.1 那些被“遗漏”的关键基因

数据量的差异直接决定了我们能“看”多远。一个最典型的例子是乙型病毒性肝炎(Viral Hepatitis B)。乙肝在东亚地区属于高发传染病,但在欧洲人群中相对罕见。在著名的英国生物样本库(UK Biobank)中,乙肝病例仅有132例,这使得研究人员几乎无法从中提取出有效的遗传信息。相比之下,TPMI队列中拥有高达23,618名乙肝病例。

这种数据优势带来了爆发式的科学发现。如图[3]所示,这是TPMI研究中针对乙肝进行的GWAS分析曼哈顿图(Manhattan plot)。图中的每一个高耸的“点阵塔”都代表了一个与乙肝显著相关的基因座。研究团队不仅确认了已知的风险位点,更一口气发现了19个全新的独立遗传位点(例如图中标记的 WAKMAR2, LOC101926943 等)。这些新发现的位点大多与肝功能或免疫调节密切相关,为我们理解为什么东亚人更易感乙肝、以及乙肝如何在该人群中通过遗传机制影响疾病进程提供了关键线索。

Figure 3

Figure 3

此外,研究还发现了一些在汉族人群中频率较高、但在欧洲人群中极低频的“私有变异”。例如,基因 PIBF1 上的一处突变(rs17089782)与甲状腺癌风险高度相关。这个突变在TPMI人群中的携带率约为5.65%,而在欧洲人群中仅为0.01%。这就解释了为什么之前的欧美大型研究从未“注意”到它——因为它在那个群体里几乎不存在。这些发现有力地证明:只有用特定人群的数据,才能真正解决特定人群的健康痛点。

3. 量身定制的“预测模型”:汉族专属PRS

发现致病基因只是第一步,更具临床应用价值的是将成千上万个微小的遗传风险位点整合起来,构建出一个多基因风险评分(Polygenic Risk Score, PRS)。这就像是给每个人的基因组打一个综合分数,用来预测其未来患某种疾病的概率。

长期以来,业界的一个痛点是:直接套用基于欧洲人数据训练出来的PRS模型,在预测非欧洲人(如中国人)的疾病风险时,准确度往往会“大打折扣”。本研究的一个核心贡献,就是开发了一套基于汉族大规模数据的PRS模型,并证明了它在东亚人群中的优越性。

研究团队利用TPMI数据训练了针对多种疾病的PRS模型,并在独立的外部数据集——台湾生物样本库(TWB)以及UK Biobank和“All of Us”项目中的东亚裔人群中进行了验证。验证结果令人振奋:

如图[4]所示,这是不同来源的PRS模型在预测准确度(AUC)上的“擂台赛”。图中展示了针对前列腺癌、乙肝、2型糖尿病、高血压等多种疾病的预测表现。请注意观察图中的符号对比:

Figure 4

Figure 4
  • 圆形点(TPMI-derived):代表使用本研究(汉族数据)构建的PRS模型。
  • 三角形点(UKB-derived):代表使用传统欧洲数据构建的PRS模型。

从图[4]中可以清晰地看到,在几乎所有测试的疾病中,TPMI模型(圆点)在东亚人群(无论是台湾本地还是海外东亚裔)中的预测准确度都显著高于欧洲模型(三角形)。特别是在乙肝(Viral hepatitis B)、2型糖尿病(Type 2 diabetes)和高血压(Hypertension)等疾病上,针对汉族人群定制的PRS模型表现出了压倒性的优势(圆点位置明显高于三角形)。

这一结果直观地告诉我们:基因预测模型具有很强的“人群特异性”。 对于中国人的疾病风险预测,使用中国人自己的数据训练出来的模型,才是最精准、最可靠的“算命”工具。

4. 1+1>2:疾病“抱团”带来的预测飞跃

除了单病种的精准预测,这项研究还揭示了一个有趣的现象:疾病在遗传层面是倾向于“抱团”的。研究人员发现,某些疾病之间存在高度的遗传相关性,并聚集成簇。例如,2型糖尿病、高血压和肥胖(BMI)就形成了一个紧密的“心脏代谢疾病簇”;而乙肝、系统性红斑狼疮等则构成了“自身免疫与感染疾病簇”。

既然疾病之间有“亲戚关系”,那么在预测A病风险时,是否可以参考B病的遗传信息呢?答案是肯定的。研究团队开发了一种名为“多性状PRS”(PRSmix+)的进阶模型,利用这些相关性来增强预测能力。

如图[5]所示,这是多性状PRS模型(蓝色柱状图)与传统单性状PRS模型(红色柱状图)在解释疾病表型变异(r2r^2r2)能力上的对比。每一行代表一种疾病或性状,灰色条带代表遗传力的上限。

Figure 5

Figure 5

从图[5]中我们可以清晰地看到,蓝色条柱普遍长于红色条柱,这意味着引入关联疾病的信息后,预测模型的性能得到了显著提升。特别是在心脏代谢疾病簇(图a部分),多性状模型的解释能力平均提升了1.77倍。对于像2型糖尿病、高血压这样复杂的慢性病,这种“组团式”的预测策略无疑能更敏锐地捕捉到高风险人群。

论文信息

  • 标题:Population-specific polygenic risk scores for people of Han Chinese ancestry.
  • 论文链接:https://doi.org/10.1038/s41586-025-09350-y
  • 论文一键翻译:点击获取中文版 ➡️
  • 发表时间:2025-12
  • 期刊/会议:Nature
  • 作者:Hung-Hsin Chen, Chien-Hsiun Chen, Ming-Chih Hou, ..., Cathy S J Fann

本文由超能文献AI辅助创作,内容仅供学术交流参考,不代表任何医学建议。

分享

本页内容

文献AI研究员

20分钟写一篇综述,助力文献阅读效率提升50倍。

立即体验

用中文搜PubMed

大模型驱动的PubMed中文搜索引擎

马上搜索

文档翻译

学术文献翻译模型,支持多种主流文档格式。

立即体验
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2025

推荐阅读

Article Cover

全球5亿人的痛楚有解?肉毒素精准阻断神经炎症的新机制

学术资讯

全球5亿人正遭受神经病理性疼痛折磨。肉毒素A型被发现能通过抑制Cblb蛋白,恢复Pdlim1水平,进而阻断NF-κB通路,抑制小胶质细胞焦亡及炎症因子释放,从而缓解神经炎症和疼痛,为顽固性疼痛提供新解。

2025/12/14 13:14:45
Article Cover

糖尿病患者种牙总失败?科学家找到关键“骨再生开关”,修复率有望大幅提升

学术资讯

首都医科大学附属北京口腔医院的研究团队发现,circ_0054633是调控糖尿病患者骨骼再生能力的关键分子开关,其缺失导致骨再生下降,补充后可显著恢复。这一发现有望为糖尿病患者的种植牙和骨缺损修复带来新希望。

2025/12/14 20:28:59
Article Cover

提升流感疫苗接种率的终极指南:239万人数据背后的科学真相

学术资讯

一项涉及全球239万人的重磅研究揭示了提升流感疫苗接种率的科学真相。文章系统性分析了四类干预策略,详细阐述了针对老年人、儿童、孕妇和医护人员等不同人群的“通关秘籍”,指出医生的权威建议、多目标组合拳和个性化提醒的有效性,并强调了在低接种率地区引入成熟经验的“黄金窗口期”,同时警示了某些“高大上”策略的无效性及对偏远地区关注不足的问题。

2025/12/22 08:27:08
Article Cover

9.5%中国男性的隐痛:大数据揭示偏头痛背后的“腰围”与“钱包”危机

学术资讯

中国男性偏头痛患病率达9.5%,远超预期。最新研究揭示,腰围(肥胖)与钱包(收入)竟是头痛主要诱因。失业压力也显著增加风险,而简单模型在预测上更胜复杂AI。文章旨在打破性别刻板印象,呼吁男性关注健康,强调体重管理、经济稳定及心理健康对预防头痛的重要性。

2025/12/16 16:40:10
Article Cover

当AI坐上诊室:AMIE诊断准确率超越医生的背后

学术资讯

Nature发表的盲测研究显示,谷歌医疗AI AMIE在159个临床场景中诊断准确率、沟通能力均优于全科医生。但文字对话模式的局限性提醒我们:这不是真实医疗的全貌。

2025/12/3 15:24:46
Article Cover

发论文必须“交出”原始数据?220本顶刊10年政策大变局

学术资讯

一项跨越10年的研究揭示,顶刊正强制要求发表论文时必须公开原始数据,以应对科学界的信任危机。这一趋势在生命科学、经济学等领域尤为显著,预示着未来科学研究将更加透明、可信,并加速新发现的产生。

2025/12/16 21:55:15