文献详解丨一文解析纯生信热点——预后模型套路
2021-04-24 作者:i生信 点击:24


结直肠癌(CRC)是一种发病率和死亡率都很高的常见恶性肿瘤。并且其预后具有高度的异质性,这很大程度上阻碍了准确的临床决策。多项研究表明免疫系统对结直肠癌的发展和治疗都发挥了不可忽视的作用,因此作者提出根据免疫相关基因的mRNA水平来综合判断大肠癌患者的预后情况。
文章主要分析方法包括:获取免疫相关基因;筛选免疫相关的差异表达基因;由上一步筛选出的基因经单因素分析、LASSO回归和COX回归分析构建模型;模型的生存分析;对包含模型在内的临床特征进行多因素COX分析以判定模型是否可以作为独立的预后因素;诺姆图的构建。整个分析流程步骤是很完整的,而且作者从TCGA和GEO数据库中下载了数据,将TCGA 的数据分为训练组和测试组,首先由训练组的数据构建模型,随后在测试组和全部TCGA样本中进行模型的验证,最后又利用GEO数据进行了外部验证。模型的反复验证一方面能够增加可信度,另一方面也一定程度上弥补了纯生信没有实验或临床验证的短板。


研究思路



下面让我们按模块阅读一下文章。1、数据的获取作者从TCGA数据库获取的原始转录组数据包括471例结肠癌和41例癌旁正常组织,其中433例有完整生存信息。另外,作者从GEO数据库中检索了一个数据集GSE39582,其中包含566例结直肠癌样本。免疫相关基因列表从IMMPORT数据库中获取,其中有1333个在TCGA和GEO数据集中都有表达数据的免疫相关基因,它们被保留下来用于后续分析。
2、鉴定差异表达的免疫相关基因(IRGS)通过分析上述1333个IRGS在471例结直肠癌组织和41例癌旁正常组织间的表达差异,共获得76个差异表达的IRG,其中34个上调,42个下调。
3、预后模型的构建和模型预后性能的评估通过单因素Cox回归,在76个差异表达的IRG中,有5个基因与训练组患者的总生存期(OS)显著相关,包括ULBP2、GAST、LEP、PMCH和LCN1。Lasso-Cox模型进一步验证了这五个基因是评估结直肠癌患者预后的最佳组合。经过上述分析,得出风险评分Risk Score = * Express Value of ULBP2 + *Express Value of GAST + * Express Value of LEP+ *Express Value of PMCH + * Express Value of LCN1。
通过上述公式计算来自训练组、测试组、整个TCGA数据集以及GEO数据集的患者风险评分,并根据中位风险评分将样本分为高风险组和低风险组。热图显示风险评分公式中包含的五个基因在高风险组和低风险组之间的表达明显不同。KaplanMeier生存曲线显示,在训练集、测试集、整个TCGA数据集以及验证数据集中,高风险组的OS明显差于低风险组。此外,ROC分析表明,该模型可以较为有效地预测患者1年、3年和5年的OS。

4、预后模型与临床相关特征的关系及多因素COX分析这一步中,作者分析了风险评分与年龄、性别、分期、淋巴侵犯和静脉侵犯间的关系。结果表明,不同分期和不同淋巴侵犯状态的患者风险评分有显著差异,而不同年龄、性别和静脉侵犯组间的风险评分无明显差异。另外,结合相关临床指标进行多因素COX分析,显示患者年龄、分期和风险评分都是预后的独立影响因素。

5、诺姆图的构建由上一步得出的三个独立预后因素,作者构建了包括年龄、分期和风险评分在内的诺模图,并绘制了诺模图的校准曲线。通过校准曲线可以看出,该诺模图,即三个因素的组合模型,预测生存率的效果比较可观。

另外,与由单一独立预后因素组成的预后模型相比,由所有独立预后因素建立的诺模图可以更准确地评估患者的1年、3年和5年OS。此外,作者对年龄、分期、风险评分进行了决策曲线分析(DCA),并与组合诺姆图模型进行比较,结果表明,风险评分在5年OS预测中的表现与诺模图模型相当,这显示了风险评分在长期预后预测中的可靠性。



点评



注:本推文未经许可禁止转载。
阅读推荐:文献详解 | 单细胞测序数据这样分析,说不定你也能发Science文献详解 | 10分+期刊单细胞测序肿瘤研究范文,大家赶紧“抄作业”文献详解丨RNA修饰writer你听说过吗?纯生信发15+文章的新思路文献解析丨又一篇IF=肿瘤预后纯生信套路文章,巨详细的思路解析,快来复制!文献详解丨给脑胶质瘤绘制家谱,单细胞测序在肿瘤异质性和发育研究中的大显神通!
添加9904酒世界-慧慧个人微信,回收老酒、批发酒水
微信: 133309904 添加9904酒世界-慧慧个人微信,回收老酒、批发各类酒水!
识别二维码添加微信 了解酒价
回收老酒、批发各类酒水!
他会告诉你
▼

欢迎交流
加
酒友加微信
133309904
