【Nature Communications】新一代血浆蛋白质组学助力肺癌早诊提高患者生存率
研究背景
肺癌是全球癌症死亡的首要原因。肺癌患者的5年生存率为20%,但早期(1-2期)的生存率为60%,晚期(4期)仅为6% 。据全球癌症统计报告显示,2020年中国癌症死亡人数约300万,其中肺癌人数有近71.5万,占癌症死亡人数的23.8%。在过去的40年里,中国的肺癌死亡率增加了近4倍,成为第一死亡原因。尽管靶向和免疫联合治疗的进展改善了患者的短期生存,但大多数肺癌患者被诊断为晚期疾病,治愈性治疗几乎不可能。提高早期发现是延长生存率最有希望的策略。
2020年中国癌症新发病例数前十的癌症类型(图片来源:MedSci)
美国国家癌症研究所于2018年资助了肺癌病因和风险整合分析(INTEGRAL)项目,该项目专注于开发生物标志物,旨在识别即将发生但尚未确诊的肺癌循环蛋白标志物。Olink高通量超灵敏蛋白质组学方法被应用于项目中,并筛选了诊断前3年采集的血液样本中的上千多种循环蛋白质,队列样本来自肺癌队列联盟(the Lung Cancer Corsortium, LC3)。该项目的大规模分析结果近期发表于国际知名期刊Nature Communications (IF =16.60),文中研究着重于识别与肺癌诊断风险密切相关的蛋白质,描述它们的流行病学特性,所属的生物学途径,以及它们在致癌作用中的已知相关性。
前瞻性队列包括欧洲癌症和营养前瞻性调查队列(EPIC)、瑞典北部健康和疾病研究队列(NSHDS)、挪威健康研究队列(HUNT)、美国癌症协会癌症预防研究队列 (CPS-II)、墨尔本合作队列(MCCS)以及新加坡华人健康研究队列 (SCHS)。研究队列中的血浆或血清样本按照标准方案被采集处理,并储存在- 80℃或液氮中。以1∶1的比例选择对照组和病例组,最终纳入了731例肺癌病例和731例匹配对照。对照组与病例组按照年龄、抽血日期、性别、队列和吸烟信息进行了匹配。
研究流程图
使用Olink 蛋白质组学平台测量了14个Target 96 panel 中多达1,162种蛋白质的相对浓度。从欧洲EPIC 队列和瑞典NSHDS 队列中选择了252对病例对照,对所有panel进行了初步测量。随后,再从另外4个队列中选择的479对病例对照中,重新测定了一个蛋白质panel子集(总共392 ~ 484种蛋白质),选择这些蛋白质是为了最大限度地覆盖风险关联最强的蛋白质。
循环蛋白分析结合多重检验,在1162种蛋白质中发现了67种与肺癌风险相关的蛋白。采用重采样算法来模拟多次重复的拆分样本发现和复制过程,确定了36种与即将诊断为肺癌的风险具有可复制关联的蛋白质,其中35种与风险呈正相关。在36个标志物中有6个在诊断前的样本中已经被报道与肺癌相关,包括几个知名的肿瘤标志物,如CEACAM5/CEA和CA-125/MUC-1624,以及IL6、CDCP1、CXCL9和CXCL13。
经鉴定的36种肺癌诊断风险相关蛋白质生物标志物
研究者进一步描述了鉴定蛋白质的流行病学特性及其与已知危险因素(如吸烟)的关联。尽管有几种蛋白质与吸烟史呈横断面相关,但该研究发现,根据吸烟状态分层时,36种标志物中大多数的风险关联存在异质性的证据有限,并且针对吸烟特征进行额外校正的影响很小。然而,当在接近诊断的血液中测量时,确实发现36种标志物中的许多具有更强的风险关联。表面其是预测即将发生疾病的标志物,而不是疾病病因的标志物。
该工作分析支持了鉴定蛋白标志物在肺癌早期检测中的潜在作用,78%的诊断时已知分期的病例在抽血时为2期或更早,68%为1期或更早,这提示这些标志物有潜力检测出许多处于可治愈阶段的肺癌。此外,将蛋白标志物单独添加到已建立的基于吸烟的PLCOm2012风险预测模型时,风险鉴别能力有所改善。这些结果令人鼓舞,因为INTEGRAL项目的总体目标是在LDCT筛查之前使用这些标志物来改善短期肺癌风险评估。
36种蛋白质生物标志物肺癌发生比值比
在评估这36个蛋白的已知机制作用时,研究者发现它们具有广泛的分子功能,包括多种生长因子(HGF、MK、IGFBP-1、IGFBP-2、TGFalpha和VEGFA),肿瘤坏死因子受体(TNFRSF6B和TNFRSF13B),趋化因子和细胞因子(CXL17、GDF-15、OSM和SCF)。SCF是发现的唯一与肺癌负相关的蛋白质,其参与细胞存活、增殖和造血的调节。在该研究中,与肺癌相关性最强的标志物CEACAM5与腺癌的相关性高于与鳞状细胞癌的相关性。CEACAM5是一种参与细胞黏附、细胞内信号传导和肿瘤进展的表面糖蛋白。CEACAM5常规用于监测结直肠癌患者的复发,并且最近被强调为非小细胞肺癌抗体-药物偶联疗法的一个有前景的靶点。
与肺癌诊断风险相关的36中蛋白质的生物学信息
当将鉴定出的标志物映射到癌症特征时,研究者发现最常涉及的标志是“激活侵袭和转移”(19个标志物),这些标志物与在转移过程中调节细胞外基质的已知蛋白相关,如MMP12和U-PAR。第二种最常见的标志是“增殖信号”,它与17种标记相关,包括生长因子,如HGF,TGF-alpha和IGFBP-2。增殖信号传导的变化在肺肿瘤中常见,EGFR和KRAS43等已知癌基因的有害突变所产生的影响就是例证。第三个最常见的标志(14种蛋白)是“促进肿瘤的炎症”,包括CXCL9, CXCL13,CXL17,IL6和IL2-RA等标志物。这突出了炎症和免疫系统在应对或启动肺部肿瘤发展中的核心作用,癌症的炎症和转移密切相关。
与肺癌诊断风险相关的36中蛋白质网络相关性分析
为了进一步理解所鉴定蛋白质的循环浓度与肺癌诊断相关性,并评估它们是否对肺癌具有组织特异性(而不是对其他部位的癌症),研究者使用了一系列正常和肿瘤组织的公开表达数据。这项分析发现,与其他来源的细胞类型相比,只有ALPP、SFTPA1和MUC- 16这三种蛋白在正常肺细胞中主要表达。相反,有几种蛋白主要由免疫细胞表达,尽管大多数也由其他类型的细胞表达。此外,与其他肿瘤组织相比,只有一种蛋白SFTPA1主要在肺肿瘤组织中表达,而大多数蛋白在多种癌症类型中表达。目前发现的标志物中,很少有可能起源于尚未确诊的肺肿瘤组织,而是作为机体对亚临床癌症的反应而存在于循环系统中。
写在最后
采用Olink高通量超灵敏蛋白质组学,该项目筛选了1,162个蛋白质后,研究者确定了36个可能诊断肺癌的标志物,这些标志物具有广泛的功能和与癌症标志物的相关性。该研究为吸烟相关肺癌的诊断提供了血液蛋白质组的新视角,并可为寻找肺癌早期蛋白质标志物的研究提供参考。
1. https://new.qq.com/rain/a/20210919A01VTB00
2. The blood proteome of imminent lung cancer diagnosis | Nature Communications
如有需求Olink服务需求,欢迎咨询Olink认证服务商—中科普瑞
电话:021-58086128
邮箱:market@sinomics.com