【UKB数据使用攻略】Olink蛋白组学加速大型生物样本库成果转化

首页    应用案例    OLINK队列研究应用案例    【UKB数据使用攻略】Olink蛋白组学加速大型生物样本库成果转化
英国生物样本库(UK Biobank, UKB)研究始于2006年,其理念是整合基因组生活方式以及健康信息,并最终利用这些信息来更好地进行疾病预防、诊断和治疗。该队列研究涵盖英国各地超过 50 万名参与者,年龄在 40 至 69 岁之间,在初次登记后将至少被跟踪随访 30 年。英国生物样本库代表着最大的生物医学数据库以及包含基因和纵向医疗保健信息的研究资源,为研究人员提供了获取数据并推动新发现的独特机会。

图源:https://www.ukbiobank.ac.uk/
2020 年,作为英国生物样本库药物蛋白组学项目(UK Biobank Pharma Proteomics Project, UKB-PPP)的一部分,13 家领先的生物制药公司携手合作,支持对英国生物样本库大约 10% 的血浆样本进行蛋白组学分析,运用Olink explore 3072 平台对近 3,000 种蛋白质进行定量分析。这意味着如今英国生物样本库中已有超过 5.4 万个样本的蛋白质组学图谱。Olink蛋白质组学数据已于 2023 年 4 月向公众发布,可通过 DNAnexus 英国生物样本库研究分析平台进行访问和分析。截止到2024年12月,据统计已有超过120篇基于UKB数据库的发表文章。

2023年10月,
三篇Nature重磅| Olink Explore里程碑研究开启大规模人群蛋白质组学新时代,今年10月又迎来两篇基于UKB大规模人群蛋白组在国际顶级期刊 Nature Medicine (IF = 87.24)上发表的两项开创性突破研究。该项目是有史以来规模最大的单项蛋白组学研究这是一个令人激动的时刻,它彰显了将蛋白组学纳入大规模蛋白基因组学研究的非凡价值,也标志了Olink Explore平台开启了大规模人群队列蛋白质组学研究的新时代。接下来,小编将介绍如何通过利用UKB Olink蛋白组学数据库,助力研究人员科研成果转化以UKB Olink蛋白质组学数据库发表的文章为例,向大家展示UKB数据的三大主流应用:
  • 数据挖掘 :直接利用UKB Olink蛋白组学数据进行深度挖掘,获得新颖的见解或发现
  • 数据验证 :将您的Olink蛋白质学数据作为发现或者验证队列,利用UKB Olink蛋白质组学数据来验证您所得到的蛋白质特征标识
  • 数据整合: 直接将UKB Olink蛋白组学数据以及您的Olink 蛋白质数据整合到一起,为您的研究发现助力

应用一:数据挖掘

 

 

 

数据挖掘是使用UKB数据的最直接途径。近日复旦大学附属华山医院郁金泰教授、毛颖教授团队,携手复旦大学类脑智能科学与技术研究院程炜研究员和冯建峰教授团队,在Cell重磅发布大规模血浆蛋白质组研究成果,为精准医学开辟全新航道。通过深度挖掘英国生物样本库53,026 名参与者数据,经层层筛选与质控,将2,920 种血浆蛋白数据关联 406 种流行疾病、660 种偶发疾病及 986 种健康特质,构建迄今最完备血浆蛋白质组全景图

研究方法

  • 数据来源:来自英国生物样本库的 53,026 名参与者,纳入 2006-2010 年符合质量控制的 2,920 种血浆蛋白质数据,涵盖 406 种流行疾病、660 种偶发疾病及 986 种健康相关性状数据,定义流行与偶发疾病时间节点,处理多种性状变量类型。
  • 关联分析:流行疾病用逻辑回归,新发疾病用 Cox 比例风险回归,分析蛋白与疾病关联;依性状变量类型选线性、逻辑或比例优势逻辑回归分析蛋白 - 性状关联。
  • 其他分析:进行敏感性分析、亚组分析、通路富集分析、聚类分析、基因集富集分析、序贯回归模型、预测与诊断建模及孟德尔随机化分析等
研究结论

本研究为当前在血浆蛋白质组在健康和疾病领域最大规模研究,揭示了大量关联,蛋白质诊断与预测模型性能优,确定因果蛋白质与治疗靶点,构建公开资源,助于临床策略发展。系统整合健康疾病谱,深入探究蛋白质功能、因果关系与治疗潜力,基于蛋白质组聚类疾病助于重新认识疾病分类与发病机制。

应用二:数据验证

 

 

 

如果您有自己的Olink蛋白质队列或数据集,可将UKB数据集作为验证数据集,来验证您的蛋白质特征或发现。我们建议独立分析两组数据,然后在进行meta分析时进行比较,以确认您的发现。

中国慢性病前瞻性研究项目(CKB)的研究者利用UKB数据集验证他们自己的研究成果,该工作于 2023 年发表在Journal of the American College of Cardiology杂志

研究方法

  • 研究设计与人群:在中国慢性病前瞻性研究(CKB)中开展巢式病例队列研究,纳入 1971 例 缺血性心脏病IHD 新发病例与 2001 名对照,收集基线多维度数据并长期随访。利用 Olink explore平台测 1463 种血浆蛋白,为后续关联分析奠基。
  • 统计分析策略:用 Cox 回归剖析蛋白与 IHD 关联,经多重校正筛显著蛋白;借 cis - pQTLs 开展孟德尔随机化(MR)分析明确因果;并通过多种下游分析挖掘蛋白功能及药物开发潜能。
     

研究结果
  • 蛋白与 IHD 及风险因素关联:361 种蛋白与 IHD 显著相关,部分为已知标志物如 NT - proBNP 等,经风险因素调整仍有稳健关联,且蛋白间相关性适度。

  • 遗传关联剖析:361 种蛋白中 212 种在 CKB 有 cis - pQTLs,MR 分析锁定 13 种具潜在因果关联蛋白;欧洲人群中 307 种有 cis - pQTLs,16 种与 IHD 显著相关,4 种在中欧人群均得验证。

  • 潜在靶点下游分析:如 FURIN 等 13 种蛋白经表型关联、基因敲除、富集分析等,在 CVD 病理生理中作用关键,部分已有药物研发进展,部分待深入探索。

研究结论
整合分析明确 FURIN 等为 IHD 潜在靶点,部分在欧洲人群可复现。此研究为 IHD 精准防治提供方向,助力风险预测、早期诊断及新疗法开发,凸显多组学数据融合价值,为心血管病研究注入新活力、拓展新视野。
应用三:数据整合
 

 

我们经常被问及比较不同队列数据的最佳方法。一种途径是在研究中纳入重叠或桥接样本,或者在队列之间设置一个共同组,借此消除批次效应。这本质上是使两个队列保持一致,随后便可处理一个大型数据集并开展分析。当深入了解队列生物学特性时,此方法效果甚佳,不过我们也想在此指出一些注意事项。有众多因素会影响队列之间的动态变化。与 DNA 不同,蛋白质极具动态性,可受多种不同因素影响。从样本采集方式(例如采集的年份时间),到样本制备过程,再到下游对这些样本的处理,所有这些因素都会在不同程度上给数据分析与理解带来挑战。

武功秘籍:UKB数据申请指南
 

 

 
申请准备 

注册用户通过访问管理系统(AMS)申请数据库访问。需准备将要进行的研究概要、所需UKB数据字段、研究将产生的任何新数据或变量描述等资料。具体申请细节请参考网页:

https://www.ukbiobank.ac.uk/enable-your-research/apply-for-access

申请流程

1. 在UKB在线访问管理系统(AMS)中填写申请表并选择一个数据层级。

2. 将访问UKB数据的研究人员添加到申请中作为合作者。

3. 添加有权代表您所在机构签署材料转让协议(MTA)的签字人的联系信息。此人必须不是每个机构的首席研究员 / 主要合作者。

4. UKB团队将审核您的申请,并通过 AMS 中的消息与您联系,提供任何反馈。

5. 如果您的申请获得批准,将提出访问费用请求,并将 MTA 发送给您和您的授权签字人。

6. 在支付访问费用并返还签署的 MTA 后,访问团队将通知您数据已发布且可供访问。

Olink蛋白质组学数据包含在UKB Tier 3 的类型里(包括了其它的多组学数据), 标准费用为9000英镑。

福利彩蛋:免费好用的数据库
 

 

 
Olink Insight 是由Olink公司开发的一款免费的网页版开源数据库,提供一整套全面且用户友好的工具和数据集,以协助您完成研究之旅的每一步。从规划与设计到实验后数据分析,再到生成可靠的、达到可发表质量的见解与可视化成果。其中UKB数据集也已经以交互式数据故事的方式整合到Olink Insight中。

蛋白质组学疾病风险:通过将UKB中超过 5 万名个体的蛋白质检测数据与纵向医疗保健数据相结合,估算了近 3000 种蛋白质对 100 多种疾病未来发病风险的影响。提供了总结和概述,以及对具有医学研究价值的结果所做的更详细展示。
蛋白质的正常范围:这个数据故事的基础是来自代表三大洲的三个成人非疾病特异性 “正常” 队列的近 5万 份血浆样本,其中最大的队列样本取自UKB。提供的近 3000 种人类蛋白质检测的个体间变异性(正常范围)结果。它可作为研究人员进行研究设计或检测优先级排序的资源。
更多Insight功能和数据等待您的探索,请访问:
https://insight.olink.com/
 

参考资料

1. UKB官网 https://www.ukbiobank.ac.uk/

2. Cell. 2024 Nov 15:S0092-8674(24)01268-6. doi: 10.1016/j.cell.2024.10.045.

3. J Am Coll Cardiol. 2023 Nov 14;82(20):1906-1920. doi: 10.1016/j.jacc.2023.09.804.

 

如有需求Olink服务需求,欢迎咨询Olink认证服务商—中科普瑞

电话:021-58086128

邮箱:market@sinomics.com

 

 

2025年1月8日 11:18
浏览量:0