近年来,人工智能在医疗健康领域的应用正从辅助诊断向主动预防延伸。2025年9月,国际顶级期刊《Nature》发表了一项突破性研究:由德国癌症研究中心(DKFZ)、欧洲分子生物学实验室(EMBL)与哥本哈根大学联合开发的AI模型Delphi-2M,首次实现对个体未来20年内1000余种疾病风险的精准预测。这一进展不仅打破了传统疾病预测模型的局限,更为个性化健康管理和精准预防医学提供了全新工具。

1. 从单病种到千种疾病:AI预测模型的范式突破

长期以来,疾病风险预测工具多聚焦于单一病种,例如糖尿病、乳腺癌或心血管疾病。这类模型虽能在特定疾病上实现较高准确性,但难以应对人类健康的复杂性——人体是一个动态系统,一种疾病的发生可能与多种既往健康事件相关,而国际疾病分类第十版(ICD-10)中仅顶层诊断类别就涵盖逾千种疾病。

传统预测模型的两大瓶颈在于:一是无法建模疾病事件间的时间依赖性(如高血压如何逐步增加心脏病风险),二是难以整合生活方式、用药史、检测指标等多元数据。Delphi-2M的出现正是为了突破这些限制:通过生成式AI技术,它能同时处理上千种疾病的预测任务,并捕捉健康数据中的动态关联。

Tips:为什么多病种预测比单病种更难?
人体疾病并非独立发生。例如,肥胖可能同时增加糖尿病、脂肪肝和关节炎的风险,而糖尿病又会进一步升高心血管疾病概率。传统单病种模型仅关注单一疾病的风险因素,忽略了疾病间的“级联效应”,而Delphi-2M通过时序建模,能更接近真实的健康演变过程。

2. Delphi-2M的技术内核:GPT架构如何“读懂”健康数据

Delphi-2M的研发团队汇集了医学、计算生物学和AI领域的顶尖力量。模型的核心竞争力源于两大支柱:改进的Transformer架构超大规模健康数据训练

2.1 基于GPT的“健康解码器”

模型采用了与ChatGPT同源的Transformer架构,并针对医疗数据特点进行优化。不同于自然语言处理中的文本序列,健康数据包含病史记录(如“2018年确诊高血压”)、检测指标(如血糖、胆固醇波动)、生活方式(如吸烟史、运动频率)等非结构化和结构化混合信息。Transformer的注意力机制能像“智能放大镜”一样,聚焦关键时间节点(如某次突发血糖升高与5年后糖尿病的关联),并并行整合多源数据。

2.2 40万人群数据“喂饱”模型

训练数据来自英国生物银行(UK Biobank)的40万参与者,涵盖了他们10年以上的随访记录,包括:

  • 电子健康档案(门诊、住院病史)
  • 实验室检测指标(血常规、肝肾功能等)
  • 自报信息(饮食、运动、家族病史)
  • 处方记录(药物类型与使用时长)

如此大规模的多维数据,为模型学习疾病发生规律提供了“样本库”。

Tips:Transformer架构在医疗数据中的独特优势
传统循环神经网络(RNN)处理长时序数据时容易出现“遗忘”问题(如早期健康事件对远期疾病的影响被忽略),而Transformer通过“自注意力机制”可直接关联任意时间点的数据,例如将25岁时的BMI数据与45岁心脏病风险建立联系,这对长期疾病预测至关重要。

3. 1000+疾病风险预测:数据指标背后的临床价值

Delphi-2M的核心能力可概括为“广覆盖、长周期、个性化”,具体表现可通过关键数据指标直观体现:

Delphi-2M核心技术指标速览

能力维度 具体表现 临床意义
疾病覆盖范围 1000+种(ICD-10顶层分类) 覆盖从常见病(高血压)到罕见病(如多发性硬化)
预测时间跨度 最长20年 支持中长期健康规划,而非短期风险预警
预测准确性(AUC) 英国生物银行数据0.69±0.09 与单病种模型相当,多病种场景下表现优异
外部验证表现 独立数据集AUC 0.67±0.09 未调整参数直接迁移,泛化能力良好

3.1 从“概率”到“个性化方案”

模型不仅输出疾病风险概率,还能生成可视化报告,标注关键风险因素。例如,对一位40岁男性,模型可能提示“未来15年2型糖尿病风险12%”,并指出“近3年空腹血糖波动”和“缺乏运动”是主要贡献因素,帮助医生制定针对性干预方案(如饮食调整、运动处方)。

3.2 可解释性:避免AI“黑箱”

不同于部分AI模型的“黑箱”特性,Delphi-2M通过“特征重要性分析”可追溯预测依据。例如,当模型预测心脏病风险时,会明确显示“收缩压>140mmHg的累计时长”“低密度脂蛋白水平”等因素的权重,这让医生和患者能理解风险来源,增强对干预措施的信任。

4. 从实验室到临床:模型的泛化能力与现实挑战

尽管实验室数据亮眼,模型走向临床仍需跨越多重障碍。

4.1 数据多样性考验泛化能力

外部验证中,模型在非英国人群数据集上的AUC降至0.67(英国数据为0.69),提示数据“地域偏差”可能影响准确性。例如,英国人群饮食结构(高乳制品)与东亚人群(高碳水)差异,可能导致模型对相关疾病(如骨质疏松)的预测出现偏差。未来需纳入更多元人群数据(如亚洲、非洲队列)以提升普适性。

4.2 罕见病预测仍是短板

由于罕见病病例少(如每10万人仅1例的遗传病),模型训练数据中样本不足,导致这类疾病预测准确性较低(AUC多低于0.6)。研发团队表示,未来可通过“迁移学习”(利用常见病数据辅助罕见病建模)或多中心数据合作解决这一问题。

Tips:模型泛化能力为何重要?
临床应用中,模型需适应不同种族、年龄、地域的人群。例如,基于欧美人群训练的心血管疾病模型,可能低估亚洲人群中高血压对脑卒中的影响(亚洲人群脑血管结构差异)。因此,“跨人群泛化”是AI医疗模型从实验室走向临床的关键门槛。

5. 精准预防时代:AI如何辅助医疗决策

Delphi-2M的问世,并非要替代医生,而是成为“精准预防”的“决策助手”。

5.1 弥补传统体检的“滞后性”

传统体检多为“快照式”检查(如年度体检),难以捕捉疾病发展的动态趋势。Delphi-2M基于长期数据预测,可在疾病萌芽阶段发出预警。例如,对肺癌高风险人群,模型可建议提前进行低剂量CT筛查,而非等到出现咳嗽、咯血等症状。

5.2 推动“治未病”落地

中医强调“上医治未病”,但精准预防需依赖个体化风险评估。Delphi-2M可为健康人群提供“疾病风险画像”,例如:

  • 对30岁女性,提示“未来10年甲状腺功能减退风险8%”,建议定期监测TSH指标;
  • 对有家族乳腺癌史的女性,结合其生活方式数据,优化乳腺钼靶筛查频率。

5.3 伦理与隐私边界

模型依赖个人健康数据,如何保护隐私是绕不开的话题。目前,英国生物银行数据已去标识化,但未来临床应用中需建立“数据可用不可见”机制(如联邦学习),避免数据泄露风险。

结语

Delphi-2M的发表,标志着AI在疾病预测领域从“单点突破”迈向“系统整合”。尽管它仍需解决数据多样性、罕见病预测等挑战,但已为精准预防医学提供了可行路径。未来,随着更多人群数据加入、算法持续优化,我们或许能像“预知天气”一样预知健康风险,真正实现“千人千面”的健康管理。

当然,技术终究是工具,健康的核心仍在于个体行动——AI预测的“高风险”,最终需要通过饮食、运动、定期筛查等“低风险”行为去改变。

参考链接