基于Bulk转录组整合分析的肺腺癌影像-病理进展分子机制与预后研究 一、常规手段亦可出彩基于Bulk转录组数据的高水平研究思路在当前生物信息学研究中单细胞测序、机器学习等新兴技术不断涌现成为热点方向。相比之下传统Bulk转录组分析似乎逐渐被视为“常规手段”其发表潜力常被低估。然而事实并非如此。本文分享一篇典型案例该研究充分利用大规模临床Bulk转录组数据采用经典的差异表达基因筛选与功能通路富集分析结合对肿瘤微环境中免疫细胞浸润情况的系统评估成功识别出影响患者预后的独立风险因素。研究表明即使不依赖复杂建模方法基于常规转录组数据亦可实现具有创新性和临床意义的深入探索。题目驱动肺腺癌病理和放射学进展的分子事件的差异杂志eBioMedicine影响因子IF11.1发表时间2023年7月二、研究背景随着肺癌早期筛查技术的广泛应用肺内磨玻璃结节Ground-glass opacity, GGO的检出率显著提高。GGO在影像学上表现为密度轻度增高的云雾状阴影病灶内原有的血管和支气管纹理仍可清晰辨认是早期肺腺癌的常见影像学表现形式。根据实变成分在肿瘤中所占比例的差异即实变-肿瘤比consolidation-to-tumor ratio, CTR可将肺结节进一步细分为三种影像学亚型纯GGOpGGO, CTR0表现为完全无实变成分混合GGOmGGO, 0CTR1同时存在GGO与实变成分以及纯实性结节CTR1表现为完全实变。这一影像学分型系统为肺结节的良恶性鉴别及临床决策提供了重要依据。值得注意的是纯GGO多对应于肺腺癌的浸润前阶段或微浸润阶段如非典型腺瘤样增生或原位腺癌。大量临床研究表明以GGO为主要表现的肺腺癌通常呈现缓慢的生长速度和较低的侵袭性预后相对良好因而被视为一类具有“惰性”生物学行为的肿瘤亚型。然而部分GGO病变在随访过程中可能出现实变成分增加提示其可能向更具侵袭性的表型演进这一转变背后的分子机制尚待深入阐明。三、数据来源与数据集信息数据集标识数据类型数据信息EGAS00001004006转录组数据LUAD病人病理组织测序和临床信息GSE31210转录组数据GSE13213转录组数据GSE11969转录组数据GSE50081转录组数据GSE68465转录组数据GSE42127转录组数据GSE26939转录组数据GSE72094转录组数据GSE30219转录组数据GSE41271转录组数据TCGA基因组数据TCGA转录组数据四、研究思路与实验设计本研究旨在系统解析驱动肺腺癌放射学分期与病理分期的关键分子事件通过整合多组学数据从基因组特征、基因表达谱及肿瘤微环境三个维度对不同进展阶段的肺腺癌进行比较分析。研究对象涵盖原位腺癌adenocarcinoma in situ, AIS、微浸润腺癌minimally invasive adenocarcinoma, MIA及浸润性肺腺癌lung adenocarcinoma, LUAD并依据影像学表型将其进一步划分为纯GGO、混合GGO及实性结节三种亚型以构建放射学-病理学-分子特征的关联图谱。研究设计流程如图1所示主要分析步骤包括首先通过比较GGO样LUAD与实性结节LUAD的分子特征发现前者呈现出较低的恶性程度其分子表型更接近于前/微浸润阶段的AIS与MIA。具体表现为基因组事件频率较低、细胞增殖活性较弱以及基质重塑相关通路的激活程度较低提示GGO样LUAD在分子层面仍保留了一定的“惰性”特征。其次研究进一步探讨了不同放射学亚型在各病理阶段内部的分子差异。结果显示在AIS与MIA阶段纯GGO与混合GGO之间的基因组差异并不显著然而进入LUAD阶段后分子特征出现明显分化。与AIS及MIA相比LUAD中EGFR突变频率显著升高拷贝数变异copy number variation, CNV负荷亦明显增加提示这些基因组事件可能与肿瘤的侵袭性获得密切相关。此外研究还对肿瘤微环境中的免疫细胞组成进行了系统评估。结果表明调节性T细胞Treg与CD8 T细胞等免疫细胞群的浸润状态与病理分期的关联性强于其与放射学分型的关联提示免疫微环境的重塑更倾向于伴随肿瘤的病理进展而非影像学表型的转变。基于上述发现研究最终构建了一个整合放射学特征、病理分期与基因表达信息的分子标记。该标记能够有效反映肺腺癌的多阶段进展过程并在多个独立数据集中展现出良好的预后预测效能为肺腺癌的精准分型与个体化预后评估提供了新的工具。图1 实验设计流程五、主要结果1.病理进展与放射学进展由不同的基因组事件驱动基因组分析表明肺腺癌的病理分期演进与GGO成分变化受不同的基因组事件调控。研究首先描绘了AISMIA及LUAD中各放射学亚型pGGO、mGGO及实性结节的基因突变谱图2a。结果显示在同一病理阶段内AISMIA或LUADpGGO与mGGO之间的肿瘤突变负荷tumor mutation burden, TMB无显著差异然而LUAD的TMB显著高于AISMIA图2bAISMIA-mGGO vs. LUAD-mGGO。在LUAD内部实性结节的TMB显著高于GGO样结节图2bLUAD-mGGO vs. LUAD-Solid提示TMB的累积与病理进展及实性成分增加均密切相关。进一步分析发现实性结节患者中吸烟者比例显著高于GGO结节患者而吸烟史与高TMB呈正相关。研究进一步聚焦于APOBEC相关突变特征CG及CT突变该类突变在多种肿瘤发生发展中发挥重要作用。结果显示LUAD实性结节患者的APOBEC富集评分显著高于GGO结节图2cLUAD-mGGO vs. LUAD-SolidAISMIA-mGGO vs. LUAD-Solid而吸烟状态对APOBEC富集评分的影响在各亚组中并不显著。通过将突变特征分解为COSMIC单碱基置换特征SBS signatures研究发现吸烟相关特征SBS4主要富集于LUAD实性结节并与TP53突变密切相关。在实性结节中TP53突变频率显著高于GGO样LUAD图2dLUAD-mGGO vs. LUAD-Solid而TP53突变富集的SBS4信号可有效区分吸烟与非吸烟患者。此外APOBEC相关特征SBS2和SBS13的突变负荷在LUAD实性结节中也显著高于GGO结节。EGFR作为LUAD中最常见的突变基因其突变频率在LUAD中显著高于AISMIA图2dAISMIA-pGGO vs. LUAD-Solid拷贝数变异copy number variation, CNV负荷亦呈现相似趋势。相反TP53与ERBB2突变与GGO成分密切关联LUAD实性结节中TP53突变频率高达53%显著高于mGGO组13%图2d提示TP53非同义突变可能驱动部分结节向实性转变而ERBB2突变在GGO样LUAD中呈现特异性低频率图2d。其他常见驱动基因如RBM10、KRAS、BRAF、MET及MAP2K1在GGO成分间未表现出显著差异图2d。变异等位基因频率variant allele frequency, VAF分析显示在EGFR图2eLUAD-mGGO vs. Solid及TP53图2fLUAD-mGGO vs. LUAD-Solid突变的样本中含有GGO成分的肿瘤VAF显著低于实性肿瘤。EGFR突变的VAF亦与病理分期相关图2eAISMIA-mGGO vs. LUAD-mGGO。进一步分析表明VAF的降低并非完全由肿瘤纯度较低所致提示含有GGO成分的肿瘤及AISMIA处于相对早期的肿瘤进化阶段。图2可能导致AIS/MIA变为LUAD和GGO变为实体瘤的基因组事件2.增殖相关基因模块在AISMIA及GGO样LUAD中均呈现低表达为分别鉴定与病理分期及GGO成分相关的转录组特征研究设定了四组差异表达分析AISMIA中mGGO vs. pGGO、LUAD中GGO样结节 vs. AISMIA中GGO样结节、LUAD中mGGO vs. pGGO、LUAD中实性结节 vs. mGGO|log2FC|≥1P0.05图3a。上述比较揭示病理进展与GGO成分变化均对基因表达谱产生显著影响。主成分分析PCA显示LUAD中的pGGO样本其基因表达谱与AISMIA高度接近图3b。基因集变异分析GSVA进一步证实GGO样LUAD的生物学功能状态更接近于AISMIA这为pGGO型LUAD预后与AISMIA相当提供了分子层面的解释。采用加权基因共表达网络分析WGCNA将3948个与病理及放射学进展相关的差异表达基因划分为三个共表达模块M1、M2、M3其余806个基因归为M0未模块化基因。M1与M2主要为肿瘤与正常组织间的差异表达基因模块而M3为实性结节特异性高表达模块图3c-d。功能富集分析显示M1与M2基因主要参与发育、信号传导及免疫系统相关通路图3eM3基因则显著富集于细胞增殖相关功能提示该模块的低表达可能是GGO样结节进展缓慢的分子基础。生存分析表明M3中绝大多数基因与总生存期OS及无复发生存期RFS显著相关且M3基因的风险比hazard ratio, HR分布显著高于M1及M2图3f-gOS: M1 vs. M2, P0.001M2 vs. M3, P0.001RFS: M1 vs. M2, P0.01M2 vs. M3, P0.01。综上所述GGO样LUAD中增殖相关及预后不良基因的低表达从转录组水平解释了其生长缓慢及预后优于实性结节的临床特征。图3 细胞增殖相关基因表达模块在GGO样LUAD中活性较低预后较好3.病理进展与放射学进展由不同的免疫反应驱动采用Fges法对细胞增殖速率进行定量评估发现从LUAD的mGGO到实性结节增殖速率呈显著递增趋势且GGO样LUAD的增殖速率显著低于实性结节图4aLUAD-mGGO vs. Solid, P0.05AISMIA-pGGO vs. LUAD-mGGO, P0.05AISMIA-mGGO vs. LUAD-mGGO, P0.05。免疫组化检测的Ki67阳性率与转录组推断的增殖速率结果一致图4a。此外GGO样LUAD的基质重塑活性显著低于实性结节图4dLUAD-mGGO vs. LUAD-Solid, P0.05AISMIA-mGGO vs. LUAD-Solid, P0.05正常肺组织 vs. AISMIA-pGGO, P0.05提示细胞增殖与基质重塑激活可能在AISMIA向LUAD演进及GGO向实性结节转化过程中发挥协同作用。肿瘤生长不仅取决于细胞内在增殖能力亦受肿瘤微环境中免疫监视效能的影响。为探究GGO样LUAD中免疫微环境的动态变化研究采用转录组数据反卷积算法估算了各样本中免疫细胞亚群的比例图4c。结果显示与正常肺组织相比所有肿瘤样本中调节性T细胞Tregs比例显著增加而CD8 T细胞比例显著减少。Tregs比例在不同GGO组分间未见显著差异但从AISMIA到LUAD阶段呈显著上升趋势图4bAISMIA-mGGO vs. LUAD-mGGO, P0.05AISMIA-mGGO vs. LUAD-Solid, P0.05。CD8 T细胞比例在LUAD中从pGGO向实性结节逐渐下降至实性结节达最低值但未达统计学显著性图4eLUAD-Solid vs. Normal, P0.05AISMIA-pGGO vs. Normal, P0.05。流式细胞术验证了上述发现Treg数量随疾病进展稳步增加在LUAD实性结节中显著升高图4bAISMIA-pGGO vs. LUAD-Solid, P0.05LUAD-mGGO vs. LUAD-Solid, P0.05而CD8 T细胞数量则呈递减趋势。值得注意的是尽管CD8 T细胞数量下降趋势未达显著其功能状态却发生明显改变。研究发现CD8 T细胞分泌穿孔素的能力在疾病进展过程中受到显著抑制图4f正常肺组织 vs. LUAD-Solid, P0.05LUAD-mGGO vs. LUAD-Solid, P0.05。结合Tregs比例升高图4b与CD8 T细胞杀伤功能受损图4f的现象提示LUAD中免疫逃逸的可能机制在于Tregs上调所介导的CD8 T细胞功能抑制而非单纯的数量减少。图4g-h展示了穿孔素表达CD8 T细胞及Tregs的代表性流式细胞术结果。图4 肿瘤微环境的动态变化评价4.基于病理与放射学进展相关基因特征的预后预测上述结果表明与GGO-实性结节转化相关的基因在LUAD患者预后中发挥关键作用。因此量化GGO与实性结节之间的差异表达过程可能有助于LUAD患者的预后分层。同理组织学进展相关特征亦可用于预测肿瘤标本的组织学亚型及预后。根据主要生长方式LUAD可分为鳞屑样为主型、腺泡为主型、乳头状为主型、微乳头状为主型及实体为主型。其中鳞屑样为主型结节常伴有GGO成分预后较好而实体为主型腺癌通常不含GGO成分预后较差。研究推测GGO与实性结节在放射学上的生物学差异可能与鳞屑样为主型与实体为主型腺癌在组织学上的生物学差异具有相似的分子基础。对两组特征进行基因集富集分析GSEA一组为GGO vs. 实性结节另一组为鳞屑样为主型 vs. 实体为主型。结果显示8个基因集在放射学实性结节中显著富集5个基因集在组织学实体为主型中显著富集其中G2/M检查点、E2F靶基因、有丝分裂纺锤体及mTORC1信号等4个基因集在两组中均显著富集图5a-d。在TCGA数据集中发现的四个显著富集于实体为主型组织学的特征在FUSCC数据集中得到验证图5e-f。研究进一步模拟放射学与组织学进展过程筛选从GGO到实性结节及从鳞屑样为主型到实体为主型过程中显著变化的基因。通过设定|log2FC|≥1.5、P0.05的阈值在FUSCC数据集的实性结节 vs. GGO、实体为主型 vs. 鳞屑样为主型以及TCGA数据集的实体为主型 vs. 鳞屑样为主型三组比较中分别鉴定出61个在GGO/鳞屑样为主型中高表达的特异性基因GGO/鳞屑样特异性基因及36个在实性结节/实体为主型中高表达的特异性基因实性结节/实体为主型特异性基因图6a-b。通过整合12个基因表达数据集共8108个样本最终筛选出24个GGO/鳞屑样特异性基因与21个实性结节/实体为主型特异性基因的交集图6c。基于这45个基因构建了G2S评分用于量化GGO向实性结节或鳞屑样向实体为主型的演进过程。在FUSCC数据集中G2S评分随放射学及组织学进展而递增图6d-e6d: LUAD-mGGO vs. LUAD-Solid, P0.001AISMIA-mGGO vs. LUAD-mGGO, P0.01正常肺组织 vs. AISMIA-pGGO, P0.0016e: 乳头状为主型 vs. 实体为主型P0.001鳞屑样为主型 vs. 腺泡为主型P0.01正常肺组织 vs. AIS, P0.001该趋势在TCGA数据集中亦得到验证图6f微乳头状为主型 vs. 实体为主型P0.001乳头状为主型 vs. 微乳头状为主型P0.01鳞屑样为主型 vs. 腺泡为主型P0.05。在FUSCC及TCGA数据集中实性结节及实体为主型样本的G2S平均得分最高。依据G2S中位数将FUSCC数据集患者分为GGO样组与实体样组生存分析显示GGO样组的总生存期OS及无复发生存期RFS均显著优于实体样组图6g。另在11个独立数据集中重复上述分组进一步验证了G2S评分的预后预测效能图6h-i。为整合基因组与转录组信息以优化预后模型研究选取EGFR与TP53两个关键基因。鉴于从AISMIA到LUAD、以及从GGO样LUAD到实性结节的演进过程中EGFR与TP53突变频率显著增加分析其突变状态与预后的关联。结果显示EGFR突变与LUAD良好预后相关携带GGO特征且EGFR突变的患者预后最佳而携带实体特征且EGFR野生型的患者预后最差。该结论在亚洲LUAD数据集GSE31210EGFR突变高频中亦得到验证即使在未接受酪氨酸激酶抑制剂治疗的情况下EGFR突变患者预后仍优于野生型患者。TP53突变则呈现与预后不良相关的趋势。将G2S评分与TP53突变状态联合分析发现预后分层主要由G2S评分驱动TP53突变信息未显著提升模型的预后预测效能。图5 FUSCC和TCGA数据集的GSEA图6 LUAD与病理、影像学和组织学相关的预后预测特征六、小结本研究系统整合了肺腺癌患者的大规模临床病理数据与多组学信息深入探讨了GGO样肺腺癌与实体结节肺腺癌在基因组、转录组及肿瘤微环境层面的分子差异及其临床意义。