研究背景
卵巢癌是女性第八大常见癌症,其五年生存率仅为30-50%。I期患者的生存率接近90%,而IV期患者的生存率仅为20%。现已有分子生物标志物被临床用于辅助影像学检查,但尚未具备足够的准确性用于筛查/早期检测或诊断目的。1983年,MUCIN-16(也被称为CA125)首次被建议作为卵巢癌的生物标志物,目前是用于绝经后妇女诊断和治疗管理的最佳单一生物标志物。然而,MUCIN-16作为单一指标,对早期癌症的敏感性较低(50-62%),在年轻女性的许多良性妇科疾病中,如感染、怀孕和子宫内膜异位症,假阳性的发生率较高。由于难以用无创方法建立高准确度的早期诊断,导致手术过度诊断的程度很高。
目前可用的单一生物标志物对卵巢癌早期检测的敏感性和特异性不足,同时使用多种生物标志物来确定疾病状态,通常被称为「生物标志物组合」,是一种充分利用蛋白标志物的有效方法,基于多种生物标志物的检测有可望开发出具有高灵敏度和特异性的检测方法。在2021年国家药监局药审中心发布的《生物标志物在抗肿瘤药物临床研发中应用的技术指导原则》中,也提出肿瘤的发生发展是一个复杂的过程,单一生物标志物很可能不能充分反应疾病状态,并提倡通过探索性临床研究开发联合生物标志物组合,为抗肿瘤药物的个体化治疗提供更好的支持。
Ulf Gyllensten教授
本期我们将为大家推送来自瑞典乌普萨拉大学免疫学/遗传学/病理学系的Ulf Gyllensten教授团队在卵巢癌研究方向的系列工作。Ulf教授团队通过借助高灵敏高特异Olink PEA技术鉴定高精度卵巢癌生物标志物,为卵巢癌提供更准确的诊断,有望为卵巢癌高危患者提供早期筛查,降低卵巢癌患者的剖腹探查的手术率。
案例1|血浆生物标志物鉴别子宫内膜癌&卵巢癌的两步策略
队列设计:该研究共包括发现队列和独立复制队列。发现队列共包括患有卵巢癌(n = 106)、子宫内膜癌(n = 74)、良性卵巢肿瘤(n = 150)和健康人群对照(n = 399)的妇女。复制队列共包括卵巢癌(n = 280)、子宫内膜癌(n = 228)、卵巢良性肿瘤女性(n = 76)和健康对照组(n = 57)。
研究方法:利用两步筛选策略,在发现队列共筛选5个Olink Target96 panel(心血管II, 心血管III, 炎症, 肿瘤II, 神经相关panel)共计460个蛋白生物标志物。使用Spearman检验(Wilcoxon)计算发现队列中病例和对照组之间蛋白质水平显著性水平。根据良性肿瘤与癌症样本比较的p值,选择最为显著的蛋白。最终筛选出27个蛋白定制了2个Focus panel,其中包括MUCIN-16在内的15个蛋白组合,可用于卵巢癌良性以及不同阶段I–IV期的区分,并在独立的复制队列中进行验证。此外,还有另外16个蛋白组合作为子宫内膜癌与良性肿瘤的区分;其中,4个蛋白PRSS8,MK,WFDC2和IL10,在卵巢癌以及子宫内膜癌筛选的指标中有重合。
研究结论:基于Olink PEA技术在发现阶段,有27种与癌症状态相关的蛋白质被鉴定出来,其中15个蛋白组成的生物标志物组合可用于卵巢癌良性以及不同阶段I–IV期的区分。利用15个蛋白标志物组成的Focus panel,在独立复制队列中可达到0.88的敏感性以及0.92的特异性,有效区分良性肿瘤以及卵巢癌III期IV期(AUC = 0.92)。与MUCIN-16和HE4相比(AUC=0.9),该方法鉴别良性肿瘤和晚期卵巢癌的AUC明显更高。
案例2|高通量蛋白组学发现11个血浆蛋白生物标志物特征识别卵巢癌
队列设计:该研究共包括一个发现队列和三个独立复制队列。发现队列包括90例诊断为良性肿瘤的患者和79例卵巢癌I-IV期患者。第一个复制队列包括71名诊断为良性肿瘤的患者和100名I-IV期卵巢癌患者,在与发现队列相同的条件下收集;第二个复制队列由77名卵巢癌I期IV期患者组成;第三个复制队列包括106例良性疾病患者,28例处于诊断边界,93例卵巢癌I-IV期患者组成。所有来自生物库的样本都是基于卵巢癌诊断或因怀疑卵巢癌而手术诊断为良性的患者。
研究方法:该研究可视为案例一的延续,其中发现队列来自Ulf教授团队在案例一中的同一发现队列,在已经测试了460个蛋白生物标志物(共5个Target96 panel)的基础上进一步扩大筛选规模,又测试另外6个Target 96 panel,增加分析了552个蛋白质 ,包括心脏代谢、细胞调节、发育、免疫反应和代谢与器官损伤相关的panel。即该发现队列共计筛选1,012个蛋白标志物。而前两个复制队列,共筛选594个蛋白质,包括根据案例一中的研究发现的42个蛋白质(来自前5个Target96 panel中筛选后定制的两个panel),以及后续6个Target96 panel中的552个蛋白。
研究者使用测定的蛋白质组学数据进行数据分析,首先使用发现队列进行模型构建,该模型构建采用两步策略,简而言之,该策略首先识别一小部分蛋白质,即“核心”,通常由2-6种性能相对较高的蛋白质组成。然后,这个核心被其他蛋白质扩展,创建了一个多达20个蛋白质的完整模型。然后复制整个过程,每次从核心中排除一个蛋白质,确保下一个核心不与先前检测到的核心重叠。利用这一策略,通过重点关注敏感性、特异性或两者兼有(方法),建立了将良性肿瘤与卵巢癌分期I-II期、III-IV期和I-IV期区分开来的模型。这一分析产生了484个独特的模型,每对模型之间至少有一个蛋白质不重叠。基于模型排名以及实际用途影响因素考量,最后确定一个包含MUCIN-16和HE4在内11个蛋白标志物组合+年龄因素的最终模型。
研究者在两个独立复制队列中进一步评估了该11个蛋白组合的模型性能。该模型在第一个复制队列,鉴别良性肿瘤和III-IV期卵巢癌的AUC = 0.90, 敏感性= 0.91,特异性= 0.95。为了进一步验证11种蛋白质组合的模型性能,研究者进一步开发了由这11个蛋白组成的Focus panel,使用它来表征第三个复制队列中的蛋白质丰度水平差异。
研究结论:最终筛选的11蛋白以及年龄组成的模型在第四个独立队列中进行评估,其针对卵巢癌良性以及I-IV期检测的灵敏度性 = 0.85,特异性 = 0.93,AUC = 0.94。其中,卵巢癌良性与I-II期AUC为0.88,与MUCIN-16以及WFDC2其AUC为0.79相比,有显著提升。值得注意的是,这些检测结果是在约4个月内获得的,涵盖了对一千多种蛋白质的发现筛选,随后开发包括11种蛋白标志物组合特征,并进一步验证了这11种蛋白组合定制panel对卵巢癌的检测灵敏度及特异性。
案例3|新一代血浆蛋白质组学发现高精度卵巢癌生物标志物组合
队列设计:该研究共包括两个未经治疗的良性或恶性卵巢肿瘤患者的临床队列,作为发现队列和复制队列。发现队列共包括N = 111个样本,独立复制队列包括N = 37个样本。
研究方法:采用Olink Explore平台对来自两个队列的148个样本中1463个血浆蛋白进行了高精度分析。通过对数据结果进行了多层次的分析,在发现队列中发现共有32种蛋白质可用于卵巢癌分期。与对照组相比,病例中32种蛋白质的浓度都更高,且其中28种蛋白在第二队列中重复了这种相关性。
研究者进一步使用发现队列数据,建立将良性肿瘤与恶性肿瘤分离的多变量预测模型,对符合该标准的175个蛋白,进行多变量模型分析。建立了4个多变量模型: 良性vs I-IV期、良性与I-II期、良性与III-IV期和I-II期与III-IV期。每个模型使用发现队列进行训练,并使用复制队列数据进行评估。每个模型由3到7个蛋白质组成,在所有模型中总共有11个蛋白质。
早期检测模型(良性与I–II期区分)由7个蛋白组成(ALPP、 IL6、 KRT19、P29460、SIGLEC5、TSPAN1和WFDC2);晚期检测模型(良性与III–IV期区分)4个蛋白(DPY30、PAEP、VTCN1和WFDC2)组成;各个阶段模型(良性与I-IV期)由5个蛋白(IL6、KRT19、PAEP、SIGLEC5和WFDC2)组成;早期与晚期分离模型(I-II期与III-IV期)由3个蛋白组成(CXCL8、KRT19和PAEP) 组成。该多变量模型显示,与单一指标MUCIN-16相比,对于良性和恶性肿瘤的区分均有更高的AUC。
研究结论:采用单变量模型分析发现32种蛋白在恶性病例中显著高于良性诊断,其中28种蛋白在第二队列中验证了这种相关性。多变量建模确定了3个高度准确的模型,每个模型基于4-7个蛋白质,用于区分早期和/或晚期卵巢癌中的良性肿瘤,在复制队列中,所有模型的AUC均高于0.96。
写在最后
Ulf Gyllensten教授团队通过大规模血浆蛋白质组筛选,研究鉴别女性卵巢癌的能力,发现并验证了新的生物标志物组合,其性能优于现有临床单一生物标志物MUCIN-16。基于多种生物标记物的检测显示出高灵敏度和特异性,有望被进一步开发以及应用。超高灵敏度蛋白质组学Olink PEA技术使用极少量样本,即可表征上千种血浆蛋白质标志物,以用于开发具有卵巢癌预测能力的生物标志物组合。PEA Explore技术不仅可应用于血浆/血清样品,还可以应用于其他临床样品基质,如干血斑。这为建立基于自我收集的临床样本的筛查方案提供了新的可能性,并结合精确生物标志物的高敏感性分析,为卵巢癌早期检测提供一种更经济高效的解决方案。
1.https://www.cde.org.cn/main/news/viewInfoCommon/321ca4648e2e2dfc8ac05e9ba28d6de
2.https://stias.ac.za/fellows/ulf-gyllensten/
3.Enroth S. et al. A two-step strategy for identification of plasma protein biomarkers for endometrial and ovarian cancer. Clin Proteomics. 2018 Dec 1;15:38.
4.Enroth S. et al. High throughput proteomics identifies a high-accuracy 11 plasma protein biomarker signature for ovarian cancer. Commun Biol. 2019 Jun 20;2:221.
5.Gyllensten U. et al. Next Generation Plasma Proteomics Identifies High-Precision Biomarker Candidates for Ovarian Cancer. Cancers (Basel). 2022 Mar 30;14(7):1757.