摘要
传统Kaplan-Meier生存曲线仅能实现群体层面生存趋势统计,忽略患者个体异质性;个体化生存模型可结合患者临床与基因组特征生成专属生存曲线,便于医患沟通。但多组学数据高维度、异质性特征极大提升建模与解析难度。为此,本文开发CPSM一体化R程序包,整套分析流程划分为4大模块共10项核心函数:
① 数据预处理与标准化;
② 特征筛选;
③ 生存风险预测建模;
④ 可视化与列线图绘制。
基于TCGA胶质母细胞瘤 (GBM)、急性髓系白血病 (LAML)、胰腺腺癌 (PAAD)、浸润性乳腺癌 (BRCA) 4类公共数据集完成工具验证,该软件可处理超6万条转录本的超高维数据,依托重复交叉验证+不确定性量化实现稳健个体化生存预测。综上,CPSM为整合多源数据、开展个体化肿瘤预后评估提供易用、完整的分析方案,程序开源发布于Bioconductor与GitHub平台。
https://github.com/hks5august/CPSM
uma@mail.nih.gov
#癌症 #生存 #预测 #生物信息学 #R包 #生物标志物
材料与方法
程序架构与核心函数
图1CPSM整体分析流程框架示意图
结果
表14种癌症各模型生存概率预测性能汇总
内部5折交叉验证+独立测试集:C指数、平均绝对误差MA、综合布里尔分数IBS
表24种癌症各模型风险分层预测性能汇总
内部5折交叉验证 + 独立测试集:错分率、准确率、灵敏度、特异度
与现有程序对比
表3CPSM与主流生存分析R包功能对比
详细总结
思维导图
参考
Gigascience. 2026 Jun 2:giag067. doi: 10.1093/gigascience/giag067.
CPSM: An R Package for Cancer Patient Survival Risk Model Using Transcriptomics and Clinical Data
260602CPSM.pdf
注:AI辅助创作,如有不当欢迎指出。内容仅供参考,不构成任何建议。