【Nature Medicine】英国剑桥大学团队使用Olink蛋白组学开创上百种疾病预测新纪元
疾病早期诊断的重要性,在现代医学中不言而喻。然而,许多疾病由于缺乏客观的生物标志物而难以及时诊断。英国剑桥大学Claudia Langenberg团队联合GSK等多家研究单位,在国际顶级期刊 Nature Medicine (IF = 87.24)上发表了一项开创性突破研究:该研究通过分析大规模人群队列——英国生物样本库制药蛋白质组学项目(UKB-PPP)中的血浆蛋白质组学数据,建立了可预测218种常见和罕见疾病未来10年发病率的早期风险预测模型,并为每种疾病确定了预测效果最佳的蛋白特征模型。
GenomeWeb网对本文和下期将解读的另一篇UKB重磅文章进行了专栏评述:文中指出这两篇文章再次利用2023年秋天对外公开的英国生物样本库蛋白组学数据库,该数据中包括对54,000个参与者的近3,000种基于Olink Explore的蛋白标志物数据,进一步加速了对疾病风险和生物学的大规模研究;同时对两篇重磅文章的研究背景、团队观点及未来前景进行了详细介绍。
-
系统性研究了218种不同疾病的10年预测模型,其潜力超过基于常规检验和多基因风险评分模型;
-
确定了每个疾病的特异性蛋白标志物,与各种疾病共有的标志物相比,这些特异性标志物指向了潜在的病因机制;
-
确定了蛋白组特征对疾病筛选指标是否达到或超过当前临床实践中使用的血液化验指标。
UBK研究是一项基于大规模人群的队列研究,在 2006 年至 2010 年(基线评估)期间招募了约 50 万名年龄在 40 岁至 59 岁之间的英国参与者。参与者的表型和基因数据均可深入了解,包括血液和尿液生物标记物、全身成像、生活方式指标、体格和人体测量、全基因组基因分型、外显子组和基因组测序。
UKB-PPP对约 54,000 名 UKB 参与者的 EDTA 血浆样本进行了蛋白组学分析。研究设计包括三个要素:(1) 46,595 人的随机子集;(2) UKB-PPP 联合体成员选择的 6,356 人,对基线评估的样本进行蛋白质组学分析;(3) 1,268 人参加了 COVID-19 成像研究,并在多次访问中重复成像。
作者在 UKB-PPP 中随机挑选了41,931名参与者,使用 Olink Explore对 2,923 种蛋白质的检测结果开发了 218 种疾病的预测模型,同时验证和比较了含蛋白和不含蛋白的预测模型性能差异。
在 67 种罕见病和常见病中,添加 5-20 个蛋白可显著改善临床模型(C指数的中位增加值 = 0.07,范围 = 0.02-0.31)。对于 67 种疾病中的 52 种,与使用血液化验的临床模型相比,基于蛋白特征模型获得了更高的似然比(Likelihood Ratio, LRs)(范围为 0.13-5.17)。
在临床模型(黑点)上添加5-20个蛋白质(彩点)可改善C指数
在这67种疾病中,与单个信息量最大的蛋白质相比,稀疏蛋白特征(5-20 个蛋白质)的 C指数比临床模型平均提高了 5.4%,其中对血液病或免疫病的预测能力提高了 8 倍多。其中64%的疾病,最多只需5-10个蛋白就能达到最大性能。
另外,作者还发现有14种疾病的预测性能在男性和女性之间存在显著差异。有39种疾病的预测性能在不同发病年龄(发病年龄<65岁vs 发病年龄≥ 65 岁)中有显著差异。
● 具有多种疾病和单一疾病预测能力的蛋白
具有临床改善性能的 67 个预测模型共包括501个蛋白,其中 147 个被选中用于两种或两种以上疾病,其中大多数(约 89%)被选中用于两种或两种以上临床专科疾病。平均而言,与高度特异性蛋白相比,这些蛋白质对预测单个疾病的贡献率相对较低。
预测多种疾病的蛋白质
研究人员也发现了只对一种疾病有显著预测作用的蛋白(下图)。与特定疾病的选择得分相比,这些蛋白在其他疾病中的特征选择得分平均低 86%。这些蛋白包括 TNF 受体超家族成员 17(TNFRSF17 或 B 细胞成熟抗原)—— 多发性骨髓瘤(MM) 的特异性预测因子,以及 TNFRSF13B —— 单克隆性淋巴瘤病(MGUS)的强预测因子,MGUS 是 MM 发病前的一种病症,这说明血浆中这些受体水平的升高可有力地预测这些血液肿瘤的未来发病情况。
预测单一疾病的蛋白质
对于 UKB 中具有多基因风险评分(PGS)的 23 种疾病,与临床模型(无血液检测)相比,PGS 仅在 7 种疾病上显著提高了预测效果(中位数delta C指数 = 0.03,范围 = 0.01-0.14),但与蛋白提高预测效果(中位数delta C指数 = 0.08,范围 = 0.02-0.30)相比,PGS的临床改善可忽略不计。蛋白在除乳腺癌之外的所有这些疾病中的表现都优于 PGS。
在广泛FPR(5-40%)范围内,蛋白模型的筛选指标在所有条件下都更优越。在 20% 的 FPR 下,蛋白组预测识别出了肺纤维化(DR = 80%)和扩张型心肌病(DR = 75%)的高风险人群。在低 FPR(5%)时,蛋白组预测发现了 MM(DR = 50%)、非霍奇金淋巴瘤(DR = 55%)和运动神经元疾病(DR = 29%)的高风险人群。
研究中报道的蛋白特征筛查指标可与目前用作诊断测试的血液测试相媲美,甚至在52种疾病中超过它们。其中特异性强的预测蛋白模型,还指出了导致疾病风险的潜在途径。比如确诊前 10 年,血浆中较高水平的 TNFRSF17 和 TNFRSF13B(BAFF 和 APRIL 的受体)分别是多发性骨髓瘤和单克隆性淋巴瘤病患病风险增加的强有力的特异性预测因子。同时与“静态 ”性质的多基因风险评分相比,循环蛋白特征动态性质能反映环境暴露的风险变化,因此表现出更优的预测性能。
最后,作者提到研究结果需要在外部研究、不同种族人群和检测前患病概率不同的队列中进行验证(UKB 具有健康参与者效应),需要更大样本量来估计罕见疾病的检出率,并根据潜在的特定疾病病因,在更短临床时间内(如 1-5 年)进行评估。
总之,作者证明了稀疏血浆蛋白特征与电子病历整合后,可通过疾病特异性蛋白和几种疾病共有的蛋白预测因子,为常见病和罕见病提供比标准临床检测更好的新预测方法。这项研究不仅在科学上具有重要的意义,更为临床医疗提供了实用工具。蛋白组学标志物的创新发现,预示着我们即将进入一个更为精准的疾病预测和个性化治疗的新时代。
1. Carrasco-Zanini, J. et al. Proteomic signatures improve risk prediction for common and rare diseases. Nature Medicine (2024). https://doi.org/10.1038/s41591-024-03142-z
2. https://www.genomeweb.com/proteomics-protein-research/uk-biobank-proteomics-data-enabling-large-scale-studies-disease-risk?utm_source=Sailthru&utm_medium=email&utm_campaign=Proteomics%20Bi%20Weekly%20-%209.3.24&utm_term=Proteomics%20Bulletin.
如有需求Olink服务需求,欢迎咨询Olink认证服务商—中科普瑞
电话:021-58086128
邮箱:market@sinomics.com