胰腺导管腺癌(PDAC)是最凶险的癌症之一。80%的PDAC患者在晚期才被诊断出来,这使得只有不到20%的患者有机会接受肿瘤切除手术。因此,PDAC的早期诊断至关重要。碳水化合物抗原19-9(CA19-9)是目前PDAC中具有临床应用价值的生物标志物,但CA19-9的升高对PDAC没有特异性,也可以在其他类型的癌症和良性疾病(如胆汁淤积)中发现。因此,寻找更准确的PDAC早期诊断生物标志物变得尤为迫切。
丹麦的研究团队在Clinical Cancer Research (中科院JCR一区,IF:12.531)发表了题为“Circulating Protein Biomarkers for Use in Pancreatic Ductal Adenocarcinoma Identification”的论文。研究者对PDAC患者(I-IV期)患者、非恶性胰腺疾病患者和健康者血清样本中的92种免疫肿瘤相关蛋白(Olink免疫肿瘤panel)和CA19-9进行了检测,采用两种不同的机器学习算法模型,找到了两种不同的标志物组合,均对PDAC具有良好诊断能力。
两种机器学习算法分别找到的10个和24个蛋白的生物标志物组合不管在发现队列还是验证队列均能很好地区分PDAC和non-PDAC, Index I中包含的9种蛋白质中的6种(MMP-7、TRAIL、FASLG、VEGFC、CD4和IL10),以及CA19-9都在Index II中排名前10位。Index I中的所有蛋白质都在Index II中表现最优质的16个蛋白质中。
研究总结
研究者使用Olink Target 96免疫肿瘤panel共检测了701例胰腺导管腺癌(PDAC)(I-IV期)患者、102例非恶性胰腺疾病患者和180例健康献血者的血清样本的92种蛋白和血清CA19-9。两种不同的机器学习算法寻找区分PDAC和非PDAC的生物标志物,分别找到含9个蛋白+CA19-9和含23个蛋白+CA19-9的生物标志物组合都能很好地区分PDAC患者和所有非PDAC患者。其中Index I中的所有蛋白质都在Index II中表现最优质的16个蛋白质中。该结果对于PDAC的诊断甚至是早期诊断具有潜在的临床应用价值。
吉凯基因凭借多年在靶标筛选及验证服务领域的技术积累,建立的标准化 、工程化 、系统化的GRP平台,为中国研究型医生提供科研服务,加快科研成果转化。其中,多组学平台包含蛋白质组学平台和单细胞测序平台:
·蛋白质组学平台拥有多台timsTOF Pro、Exploris 480高精度质谱仪,专业的Spectronaut Plusar、Mascot等分析软件,提供专业的4D、DIA、TMT、PRM、磷酸化修饰组、Olink蛋白质组等检测服务,强大的机器学习算法、IPA分析、蛋白基因组分析服务,系统的生物标志物、分子分型、药物靶点、基因功能研究等解决方案,真正让广大研究型医生的科研工作更省心、更省力、更高效;
·单细胞测序拥有10x和BD两个平台,提供单细胞RNA-seq、单细胞核测序、单细胞混样RNA-seq、单细胞(RNA+ATAC)、空间转录组测序等服务。
研究思路
研究结果
1. Olink血清样本蛋白质组学分组设置
血清样本蛋白质组产品:Olink Target 96免疫肿瘤 panel(可检测92个蛋白+血清CA19-19。
样本分组(共983例样本):701例PDAC患者(I-IV期)患者、102例非恶性胰腺疾病患者和180例健康个体。患者和健康个体详细的特征如下:
血清样本蛋白质组产品:Olink Target 96免疫肿瘤 panel(可检测92个蛋白+血清CA19-19。
样本分组(共983例样本):701例PDAC患者(I-IV期)患者、102例非恶性胰腺疾病患者和180例健康个体。患者和健康个体详细的特征如下:
2. PDAC比non-PDAC的差异蛋白
研究者首先比较了PDAC和non-PDAC个体(包含非恶性的胰腺疾病和健康人)血清中的差异蛋白,共得到78个差异蛋白(p≤0.05)。其中CA19-9、IL-8和MMP7的变化倍数最大。
研究者首先比较了PDAC和non-PDAC个体(包含非恶性的胰腺疾病和健康人)血清中的差异蛋白,共得到78个差异蛋白(p≤0.05)。其中CA19-9、IL-8和MMP7的变化倍数最大。
3. 机器学习算法寻找区分PDAC和non-PDAC的蛋白标志物
(1)Lasso回归-岭回归模型
研究者将样本分为发现队列和重复队列(即验证队列)。在发现队列(n=654)中首先使用Lasso回归-岭回归模型找区分PDAC和non-PDAC的蛋白标志物,并在验证队列(n=338)进行验证。最终找到9个蛋白+CA19-9的蛋白标志物组合(定义为Index I)可以很好地区分PDAC和non-PDAC(发现队列 AUC为0.93;验证队列AUC为0.92)。此外,Index I能很好地区分I&II期或III&IV期的PDAC与non-PDAC。
标志物组合由10个蛋白构成,分别是T细胞表面糖蛋白CD4(CD4)、细胞毒性和调节性T细胞分子(CRTAM)、Fas配体(FASLG)、IL8、IL10、单核细胞趋化蛋白3(MCP-3)、MMP-7、肿瘤坏死因子相关凋亡诱导配体(TRAIL)、VEGFC和CA19-9。
(2)Lasso回归-弹性网络模型
换用Lasso回归-弹性网络模型这一新的生物标志物模型后,找到23个蛋白+CA19-9的蛋白标志物组合(定义为Index II)可以很好地区分PDAC和non-PDAC(发现队列 AUC为0.96;验证队列AUC为0.93)。同Index I类似,Index II也能很好地区分I&II期或III&IV期的PDAC与non-PDAC。
标志物组合由24个蛋白构成,分别是caspase-8(CASP-8)、CCL3、CCL20、CCL、CCL23、CD4、CD40配体(CD40L)、CRTAM、巨噬细胞集落刺激因子1(CSF-1)、CXCL1、IL8、IL10、IL5、IL33、溶酶体相关膜表明糖蛋白3(LAMP3)、MCP-3、MIC-A/B、MMP-7、程序性细胞死亡1配体2(PD-L2)、TRAIL、VEGFC和CA19-9。
(1)Lasso回归-岭回归模型
研究者将样本分为发现队列和重复队列(即验证队列)。在发现队列(n=654)中首先使用Lasso回归-岭回归模型找区分PDAC和non-PDAC的蛋白标志物,并在验证队列(n=338)进行验证。最终找到9个蛋白+CA19-9的蛋白标志物组合(定义为Index I)可以很好地区分PDAC和non-PDAC(发现队列 AUC为0.93;验证队列AUC为0.92)。此外,Index I能很好地区分I&II期或III&IV期的PDAC与non-PDAC。
标志物组合由10个蛋白构成,分别是T细胞表面糖蛋白CD4(CD4)、细胞毒性和调节性T细胞分子(CRTAM)、Fas配体(FASLG)、IL8、IL10、单核细胞趋化蛋白3(MCP-3)、MMP-7、肿瘤坏死因子相关凋亡诱导配体(TRAIL)、VEGFC和CA19-9。
(2)Lasso回归-弹性网络模型
换用Lasso回归-弹性网络模型这一新的生物标志物模型后,找到23个蛋白+CA19-9的蛋白标志物组合(定义为Index II)可以很好地区分PDAC和non-PDAC(发现队列 AUC为0.96;验证队列AUC为0.93)。同Index I类似,Index II也能很好地区分I&II期或III&IV期的PDAC与non-PDAC。
标志物组合由24个蛋白构成,分别是caspase-8(CASP-8)、CCL3、CCL20、CCL、CCL23、CD4、CD40配体(CD40L)、CRTAM、巨噬细胞集落刺激因子1(CSF-1)、CXCL1、IL8、IL10、IL5、IL33、溶酶体相关膜表明糖蛋白3(LAMP3)、MCP-3、MIC-A/B、MMP-7、程序性细胞死亡1配体2(PD-L2)、TRAIL、VEGFC和CA19-9。
两种机器学习算法分别找到的10个和24个蛋白的生物标志物组合不管在发现队列还是验证队列均能很好地区分PDAC和non-PDAC, Index I中包含的9种蛋白质中的6种(MMP-7、TRAIL、FASLG、VEGFC、CD4和IL10),以及CA19-9都在Index II中排名前10位。Index I中的所有蛋白质都在Index II中表现最优质的16个蛋白质中。
研究总结
研究者使用Olink Target 96免疫肿瘤panel共检测了701例胰腺导管腺癌(PDAC)(I-IV期)患者、102例非恶性胰腺疾病患者和180例健康献血者的血清样本的92种蛋白和血清CA19-9。两种不同的机器学习算法寻找区分PDAC和非PDAC的生物标志物,分别找到含9个蛋白+CA19-9和含23个蛋白+CA19-9的生物标志物组合都能很好地区分PDAC患者和所有非PDAC患者。其中Index I中的所有蛋白质都在Index II中表现最优质的16个蛋白质中。该结果对于PDAC的诊断甚至是早期诊断具有潜在的临床应用价值。
吉凯基因凭借多年在靶标筛选及验证服务领域的技术积累,建立的标准化 、工程化 、系统化的GRP平台,为中国研究型医生提供科研服务,加快科研成果转化。其中,多组学平台包含蛋白质组学平台和单细胞测序平台:
·蛋白质组学平台拥有多台timsTOF Pro、Exploris 480高精度质谱仪,专业的Spectronaut Plusar、Mascot等分析软件,提供专业的4D、DIA、TMT、PRM、磷酸化修饰组、Olink蛋白质组等检测服务,强大的机器学习算法、IPA分析、蛋白基因组分析服务,系统的生物标志物、分子分型、药物靶点、基因功能研究等解决方案,真正让广大研究型医生的科研工作更省心、更省力、更高效;
·单细胞测序拥有10x和BD两个平台,提供单细胞RNA-seq、单细胞核测序、单细胞混样RNA-seq、单细胞(RNA+ATAC)、空间转录组测序等服务。