【Nature Communications】纵向健康人群队列的多重分子特征整合分析

首页    应用案例    OLINK队列研究应用案例    【Nature Communications】纵向健康人群队列的多重分子特征整合分析
 

      如何在分子层面定义个体的健康是精准医学领域中的挑战之一。此外,随着技术的发展和进步,越来越多的组学技术被应用在精准医学领域,如转录组,蛋白组,代谢组,微生物组,脂质组,免疫组等;但个体之间以及同一个体不同时间内的各组学数据之间的差异仍需要更深入研究。

      为了解开这个问题,瑞典皇家科学院院士Mathias Uhlen团队结合经典的临床化学检测,先进的医学影像学和广泛的多组学分析(包括血浆蛋白质组,转录组,脂质组,代谢组,自身抗体和免疫细胞组,肠道微生物组),对100名健康个体的多时间点纵向队列样本进行了全面的分析,以研究个体各组学分子谱在2年内的独特性和稳定性,以及各组学分子谱与常规临床化学检测之间的关系。相关研究成果近期发表在《Nature Communication》杂志。

      此研究结果表明,不仅个体间的各种组学分子谱差异很大,某些组学分子谱在同一个体中随时间变化的差异也很大,包括转录组,代谢组,脂质组,免疫细胞组以及肠道微生物组。此外,这些组学分子谱与临床经典化学检测之间相关性也较差。与之相反,个体血浆蛋白组在长达2年内均具有独特且稳定的血浆蛋白谱,而且和临床化学检测之间有很强的相关性。总之,此研究结果支持基于个体的健康定义,并表明血浆蛋白组与其他多种组学技术相比具有更稳定的结果及更高的临床转化价值。

 

 

研究设计
 

     本研究队列来自瑞典SciLifeLabSCAPIS健康人群队列(S3WP),该队列由101名年龄在50至65岁之间的受试者组成。在101名受试者中,有99名以3个月的间隔完成了第一轮的共计4次研究随访,94名以大约6个月的间隔完成了第二轮的共计2次随访(图1)。

      所有收集的样品均在多种技术平台进行了检测分析,包括基于临近延伸分析(PEA)的血浆蛋白质组分析(检测794种蛋白)、基于IgG自身抗体反应性分析(检测318种IgG)、基于质谱流式细胞技术的免疫细胞分析(检测53种可面议细胞)、基于RNA-seq的外周血单核细胞(PBMC)转录组学分析(检测11976种基因)、基于16S rRNA基因测序分析的肠道微生物群分析(检测1465种微生物)以及使用LC-MS的血浆代谢组(检测413种代谢物)和脂质组(检测169中脂质分子)(图1)。除了这些分子谱和临床化学检测(30种经典临床指标)外,研究者还对每位受试者展开详细的问卷调查并使用设备监测其身体活动水平和睡眠模式。

 

图1 S3WP 计划概述

研究结果

 

临床化学检测和生理指标测量

     作者研究的30个临床生化指标检测结果显示,作为肾脏标志物的肌酐水平在男性中明显高于女性,在纵向时间变化过程中个体的肌酐水平稳定,表明研究期间受试者的肾功能都相对稳定(图2a)。高密度脂蛋白(HDL)的结果(图2b)与低密度脂蛋白(LDL)的结果(图2c)与预期一致,分别在女性和男性中出现相对较高的表达水平。作者分析了包括体重、身高、舒张/收缩压,体重指数(BMI)等在内的生理测量参数。在个体水平上BMI的结果存在一些偏差,但平均BMI仍比较稳定(图2d)。主成分分析可发现男性和女性之间存在明显的分离(图2e)。图2f总结了所有变量之间的相互关系,发现了存在差异的指标包括人体物理测量学、血红蛋白(Hb)、肌酐、红细胞(RBC)计数、HDL、载脂蛋白A1(ApoA1)和血细胞比容等。图2g热图显示了37个临床化学检测指标与人体物理测量变量之间的相关性,揭示了大多数临床化学检测变量具有高相关性以及纵向时间稳定性。

 

图2 临床化学参数和人体测量学的纵向变异

 

分析单个组学数据集的纵向稳定性和变异性

     对于自身抗体数据,每个个体在研究期间都显示出独特而稳定的自身抗体反应性整体库,所选的IgG分子图谱几乎无变化(图3a)。与之类似的,对血浆蛋白质组分析(图3b)揭示了每个个体都有自己独特的蛋白质图谱,并在研究期间的相关结果拥有显著的稳定性。对30个临床化学检测指标进行总结分析(图3c),可以发现很多受试者的全部随访数据都彼此靠近,这表明在研究期间,大多数临床化学检测情况是独特且稳定的。同时血浆蛋白谱与临床化学检测结果都能发现由性别划分的两个亚群。

     免疫细胞图谱的结果(图3d)显示,一些受试者的免疫细胞组成稳定,而另一些受试者在两次或两次以上随访之间发生了显著变化。在代谢组(图3e)、脂质组(图3f)和微生物群(图3g)的UMAP结果中可以发现,许多个体在相关组学数据层面具有独特和稳定的特征。最后,转录组是可变性最高的数据集,且随着时间的推移显示出明显的变化(图3h)。与临床检测参数和血浆蛋白质组数据相反,转录组、自身抗体、脂质组、免疫细胞或微生物群数据在UMAP图中都没有显示出明显的性别的差别。

     对不同组学数据集进行比较分析,结果(图3i)显示,个体的变化会在多种分子层面中同时发生。例如,一个患者在第二次就诊时CRP水平显著升高(79.0 mg/L),其血浆蛋白水平、临床化学检测和转录组学的差异最大,在代谢组学和微生物组学分析中也出现较大变大。

     对8种数据集的所有变量结果进行统计分析(图3j),结果显示自身抗体数据集具有最高的组内相关性,代表个体状态最稳定。微生物群显示出最低的相关行,代表个体内变异性最大。

 

图3 总体分子谱和个体差异

 

基于相关性的综合分析

      作者对不同组学之间显著相关(小于-0.5或大于0.5)的数据进行可视化(图4a)。可以发现转录组与蛋白质组以及转录组与免疫细胞之间存在最显著的相关性。例如CD19分子与Naive B细胞高度相关(转录组学和免疫细胞组,⍴=0.82)(图4b),以及载脂蛋白 B (ApoB)与 LDL 受体34高度相关(蛋白质组学和临床化学,⍴ =0.72)(图4c)。同时,作者也发现同一特征分子在不同技术平台之间的也是高度一致的,如尿酸盐(临床化学和代谢组学,⍴=0.91)(图4d)和N末端B型利钠肽原(NTproBNP)(临床化学和蛋白质组学,⍴= 0.88)(图4e)。对每个数据集中相关性Top20的特征分子进行可视化(图4f),以发现更多的显著相关特征。结果显示脂质组主要通过脂甘油三酯(TG)、胆固醇和LDL与临床检测数据相关。蛋白质组则主要通过TCL1A与其他数据呈现高度相关,同时TCL1A在转录组数据中也与多个基因高度相关。代谢组主要与脂质组相关,但也通过肾功能生物标志物肌酐和尿酸盐与临床检测数据相联系。

图4 组间和组内相关性

 

评估组学数据集对临床检测数据的影响

     为了更全面地了解组学数据、人体测量学和临床化学检测指标之间的相互关系,作者进行了线性混合效应建模分析,目的是量化和预测组学数据对临床数据的影响。最终发现4个数据集对临床数据有显著影响:血浆蛋白质组、脂质组、代谢组和转录组,总体结果(图5a)揭示了血浆蛋白质组对临床数据的重要影响。作者还总结了四个组学数据集和每个临床数据的两个最显著相关的特征(图5b)。与预期一致,脂质组主要通过TG、鞘磷脂、溶血磷脂和神经酰胺与脂质表达谱相关联。代谢组具有更广泛的表达谱,在蛋白质组中,肝功能标志物丙氨酸转氨酶(ALAT)与其他肝酶蛋白碳酸酐酶5A (CA5A)和羟基氧化酶1(HAO1)有很强的关联,但也与ACE2前体有密切联系。而CA5A和HAO1是胞内肝酶,其在血浆中没有功能,说明存在组织渗漏或肝细胞损伤的可能。

图6 四个组学数据集与临床参数混合效应建模

 

蛋白质变异的组织特异性

     由于血液中的代谢覆盖率问题,作者研究了与各种临床数据相关的蛋白质组织特异性情况。最后约2845个基因被归类为组织特异性富集(定义标准:在一种组织类型中的转录本表达水平是其他组织类型的四倍以上),覆盖了37个细胞、组织和器官。组织富集基因列表与对临床参数存在显著影响的血浆蛋白列表进行对应,图6a显示了来自不同组织类型的组织富集基因在所有临床指标中的分布。图6b显示了不同临床参数中组织富集基因的数量,图6c显示了每个临床参数中显著相关的Top5蛋白质。结果表明,许多与临床数据高度相关的血浆蛋白质也会在肝脏中表达。胃肠道富集基因编码的蛋白质主要与脂质表达谱、糖化血红蛋白(HbA1c)、BMI和体重等相关,而骨髓和淋巴细胞的富集基因则与白细胞、红细胞等相关指标高度关联。在功能水平上,体重、腰围、CRP和WBC参与松弛素信号通路显著相关,据报道,这对小鼠饮食诱导的胰岛素抵抗和血管功能障碍的治疗具有显著作用。

 

图6 从混合效应模型中检索到的血液蛋白质组富集分析

讨论
 

     本研究通过多种模式技术实现了全面且深入的组学纵向分析。该研究发现所有数据集中个体之间的纵向变化高于个体内的变化,这突出了在个体时间跨度跟踪时需要更高的生物粒度。

     纵向血浆蛋白谱显示,大多数蛋白质在个体中是稳定的,少数在个体之间显示出显著差异。代谢组和内分泌相互联系突现出与别相关的差异,这对于后期了解健康和疾病状态时避免性别误差十分重要。因此,研究数据表明将性别之间的代谢差异作为个性化预防和治疗策略关键因素是十分重要的。

     对单层分子图谱的分析揭示了部分受试者的纵向时间观察很稳定,但许多受试者在没有明显的传染病情况下也会表现出免疫细胞组成的变化。

     当前研究的分析深度具有一定优势,但该研究队列的规模相对较小,结果需要在更大的队列中进行验证。

     总之,作者提出了一项深入的表型研究,旨在进行基于健康个体的分子监测并将偏差作为疾病发展的早期迹象,为精准医学奠定基础和参考。本研究结果支持基于个体的健康定义,展示了多组学表型研究的临床转化价值。

 

原文引用|

https://www.nature.com/articles/s41467-020-18148-7

 
 
2022年5月16日 10:04
浏览量:0