非小细胞肺癌(NSCLC)患者术后分子残留病灶(MRD)评估主要依赖循环肿瘤DNA(ctDNA)分析,但在术后单一时间点进行Landmark检测的假阴性率约为70%,导致大量复发/远处转移患者可能被漏诊,严重限制了临床实用性。近日,广东省人民医院/广东省肺癌研究所吴一龙、钟文昭教授团队在Journal of Thoracic Oncology期刊发表最新研究成果,提出了名为LAMPAD的机器学习模型,整合术前基线与术后landmark两个时间点的ctDNA定量特征,以更好地对Landmark检测不到MRD的患者进行预后分层;研究结果显示,LAMPAD识别真阴性患者效果优于单一时间点检测,从而能够更可靠地识别具有治愈潜力的低风险人群,本文将对该研究结果进行简要解读。
编者按:非小细胞肺癌(NSCLC)患者术后分子残留病灶(MRD)评估主要依赖循环肿瘤DNA(ctDNA)分析,但在术后单一时间点进行Landmark检测的假阴性率约为70%,导致大量复发/远处转移患者可能被漏诊,严重限制了临床实用性。近日,广东省人民医院/广东省肺癌研究所吴一龙、钟文昭教授团队在Journal of Thoracic Oncology期刊发表最新研究成果,提出了名为LAMPAD的机器学习模型,整合术前基线与术后landmark两个时间点的ctDNA定量特征,以更好地对Landmark检测不到MRD的患者进行预后分层;研究结果显示,LAMPAD识别真阴性患者效果优于单一时间点检测,从而能够更可靠地识别具有治愈潜力的低风险人群,本文将对该研究结果进行简要解读。
研究背景
ctDNA已成为评估各类实体瘤肿瘤负荷的可靠生物标志物,而在超高深度测序下,经滤除克隆性造血、白细胞对照等过程,肿瘤来源ctDNA变异可被从DNA片段中精准识别,并被判读为MRD。多项研究证实,ctDNA-MRD技术可精准监测实体瘤疾病进程,其发现复发的时间通常比影像学进展提前中位3至6个月,且无创特性使其具有巨大的临床应用潜力。
当前对可手术NSCLC患者,术后辅助治疗启动前(通常为术后约1个月时)的采血被定义为landmark MRD检测,以预测疗效并探索MRD在指导治疗升阶梯或降阶梯策略中的潜在作用。既往针对NSCLC的研究表明,landmark MRD具有显著的预后分层意义,即阳性患者能从辅助治疗中获益,阴性患者获益不显著,但当前landmark MRD存在特异性高、灵敏度低的问题,仅约为30%的灵敏度意味着约70%的复发患者会因单一时间点检测被漏诊,且由于术后辅助治疗通常需在4-6周内启动,狭窄时间窗内landmark MRD的预测效能亟待提升。
研究设计
本研究整合LUMPCure与Medal临床队列患者作为内部参与者,并使用LUNGCA-1与TRACERx等公开数据库数据,还前瞻性连续招募了67名接受根治性切除术的I-III期NSCLC患者(未接受新辅助治疗),在基线及术后辅助治疗前的landmark时间点采集外周血,经标准化处理后进行ctDNA-MRD分析;研究还设计定制化探针与肿瘤知情MRD目标(每例患者至多20个DNA变异,优先针对致癌驱动突变和高丰度克隆变异),以准确判读患者是否为MRD阳性。为建立稳健的无病生存期(DFS)预测模型,研究采用基于LASSO回归的特征选择逻辑。
研究者利用机器学习算法(XGBoost框架)开发了患者预后分析模型,该模型整合Cox目标函数与早停机制,通过最小化验证集负偏对数似然确定最优提升参数。为量化特征贡献度,应用了Shapley加性解释(SHAP)分析,旨在揭示特征与临床结局间的非线性关联。患者生存评估采用Kaplan–Meier法及对数秩检验进行,组间关联则通过Mann-Whitney U检验及Cox比例风险模型进行判定。所有统计分析均在R环境及专业统计软件中完成。
研究结果
LAMPAD模型框架
LAMPAD模型集成了手术前后患者血液生物标志物与临床病理特征,因此相较于单一时间点式landmark MRD评估,显著提升了对患者长期生存预测的准确性,并可有效解决检测灵敏度局限性问题;模型训练基于LUMPCure研究数据集进行,包含163名landmark时间点未检测到MRD的I-III期NSCLC患者。
研究者在基线与landmark点获取数据中,衍生出临床及ctDNA水平的49项指标及40项反映ctDNA较基线变化的特征,经Cox回归初步筛选后,引入带有自助重采样的LASSO算法实现特征降维,最终通过交叉验证与早停策略完成XGBoost生存模型的训练。模型效能通过一致性指数(C-index)评估,特征重要性则通过增益指标解析。内部验证在研究中心的前瞻性队列及Medal研究的两个子队列进行,外部验证使用LUNGCA-1与TRACERx队列数据。
△研究总体方法
LAMPAD模型的建立
最终预测模型保留了5项关键特征:基线循环游离DNA(cfDNA)浓度、基线ctDNA状况(阳性/阴性)、基线ctDNA水平、landmark时间点cfDNA浓度及TNM分期。凭借在训练与验证集中的稳定性及对2年DFS终点的预测精度,XGBoost被选定为最终建模算法。SHAP解释性分析显示,基线ctDNA定量水平是贡献度最高的预测因子,对结局预测的影响力达35%;TNM分期与landmark点cfDNA浓度的贡献度次之,影响力分别为30%和23%。值得注意的是,基线血液指标累计占据超一半的SHAP总分,凸显术前基线样本在预后模型中的核心价值。
在最终LAMPAD模型中,高水平基线ctDNA与进展期分期对应正SHAP值,预示患者复发风险高,而基线与landmark双时间点的低cfDNA浓度则对应负SHAP值,预示患者预后较好,可以此在MRD阴性患者中进一步界定出极低复发风险人群。将LAMPAD模型与landmark点MRD检测联合应用,则可把R0切除后的患者划分为2年DFS率迥异的三个亚组:MRD阴性/LAMPAD低风险(98%)、MRD阴性/LAMPAD高风险(72%)及MRD阳性(40%);LAMPAD可有效区分低风险组(5.6%)与高风险组(41.9%),且区分能力独立于临床病理变量。
△模型建立过程
多队列验证
在涵盖718例患者的五个独立验证队列中,LAMPAD模型用于不同MRD检测技术方法时的泛化性能均得到验证:采用固定Panel检测的Medal队列中,LAMPAD识别出81例低风险与52例高风险患者,并可区分出患者DFS的显著差异(HR=0.35),低风险/高风险患者2年DFS率分别为92.4%与76.4%;采用Profiling导向个性化方案的队列及基于WES定制化方案的Medal子队列中,LAMPAD均能稳健地筛选出2年DFS率为100%的极低风险人群。
而在外部验证环节,LUNGCA-1与TRACERx队列均印证了LAMPAD模型出色的DFS预测效能(LUNGCA-1:HR=0.34;TRACERx:HR=0.36)。跨队列一致性结果表明,无论MRD检测方法如何演变,LAMPAD均能维持极高的预后准确性,且校准分析显示,LAMPAD模型对DFS的预测值与临床实际观察结果高度契合,支持该模型作为通用的临床决策支持工具。
△模型验证过程
亚组敏感性分析
在354例landmark点未检出MRD的患者(内部队列汇总)中,LAMPAD模型展现了跨病理分层时的预测一致性与稳健性:尽管低风险患者占比随分期进展而降低(IA:79.7%, IB:69.7%, II/III:13.2%),但在各分期内部,LAMPAD模型判定为低风险组的2年DFS率均显著优于对应的高风险组(IA:100% vs 82.9%, IB:96.2% vs 72.8%, II/III:100% vs 77.0%)。对14例II/III期低风险患者,是否行辅助治疗并未显著改变患者良好预后(p=1.00)。
同时,LAMPAD模型表现出优于TNM分期的临床实用性,具有更高的随时间变化的C-index和AUC,更好的区分度(综合区分度改善IDI=0.0530)及改进的再分类指标(净再分类改善NRI=0.2193),并对不同EGFR突变状态的患者具有一致的预测力;同时,所有脑转移病例均发生在LAMPAD模型判定为高风险的患者中,赋予了模型极高的脑复发负预测价值。
△亚组敏感性分析
术前cfDNA溯源
基于5种LAMPAD模型关键特征的SHAP聚类分析,揭示了不同风险组间的生物学异质性:低风险患者主要为两类,一类由基线ctDNA与分期共同主导(贡献度>65%),另一类则受landmark点cfDNA水平影响;高风险组呈现出显著异质性,可分为TNM分期驱动、基线ctDNA驱动、分期-ctDNA协同驱动及基线cfDNA依赖型四类(C1-C4)。研究进一步对术前外周血样本进行了定向甲基化测序,旨在解析模型预测的生物学基础。
虽然低风险/高风险组患者基线cfDNA总量无统计学差异,但去卷积分析显示,高风险患者呈现出明显的多器官播散特征,肺部及其他器官特异性甲基化信号显著增强,且高风险患者的外周血cfDNA除源于肺泡细胞外,还主要由T细胞、B细胞及单核/巨噬细胞等免疫谱系贡献,上述发现提示,LAMPAD模型判定的高风险状态,可同时反映肿瘤直接释放的ctDNA与系统性免疫失调,为纳入术前外周血生物标志物提供了生理机制证据。
△术前cfDNA溯源
讨论
本研究开发并验证了LAMPAD模型对根治术后NSCLC患者复发风险精准分层的可行性,该模型采用基线+术后landmark双时间点设计,弥补了术后单次检测灵敏度不足的缺陷,可为辅助治疗决策提供依据;多队列验证数据表明,LAMPAD定义的低风险组2年DFS率可达100%,优于辅助治疗ADAURA研究相应数值(89%),提示模型有望助力识别可豁免辅助治疗人群。无论采用固定Panel或肿瘤知情个体化方案,LAMPAD均展现出稳健且一致的预测效能。
基于ctDNA变异分析的MRD评估正在引领实体瘤诊疗范式的变革,不论患者肿瘤分期如何,术后检出MRD均与疾病复发呈强相关,当前临床探索也大多利用MRD的高阳性预测值,识别高风险群体并实施强化治疗;然而受限于检测灵敏度,MRD阴性预测值的潜力尚未得到充分挖掘;因此在治疗“升阶梯”与“降阶梯”间寻求平衡的需求仍颇为迫切。
LAMPAD模型的构建落实了四项核心策略:(1)深度整合VAF及肿瘤分数等定量特征;(2)严格筛选具备技术普适性的变量以确保兼容主流检测平台;(3)精准对接辅助治疗决策窗,仅采集术前及术后1个月内的血样;(4)优化风险分层,将约80.2%的I期及17.6%和22.2%的II-III期患者归为低风险,与非辅助治疗背景下的临床治愈率高度契合。
模型将患者划分为Landmark阳性、Landmark阴性但高风险、以及低风险三类群体,为个体化临床研究提供了新思路,即对Landmark阳性者强化治疗,对Landmark阴性但高风险患者维持标准治疗,对低风险患者则可探索治疗豁免,类似模式与近期报告的TRACERx研究结果相似,且在不同平台间具有一致性。而从机制层面来看,术前cfDNA升高或反映NSCLC诱发的系统性免疫应激,且低风险组中肝源性cfDNA占比相对较高,可能源于高风险患者总cfDNA基数较大产生的稀释效应。
综上所述,LAMPAD模型显著提升了可手术NSCLC根治术后风险评估的精度,未来期待通过大规模、前瞻性、干预性研究,验证该模型在指导个体化辅助治疗中的实战价值。
▌参考文献:
Zhang JT, Chen KZ, Gao X, et al. LAMPAD:An Integrated ctDNA-Based Model for Predicting Potential Cure in Resected NSCLC Patients. J Thorac Oncol. Published online April 17, 2026. doi:10.1016/j.jtho.2026.103729