首页分享人工智能技术在肺结节影像学诊断中的应用：进展、挑战与展望

人工智能技术在肺结节影像学诊断中的应用：进展、挑战与展望

来源：花匠小妙招时间：2025-09-01 10:51

人工智能技术在肺结节影像学诊断中的应用：进展、挑战与展望
Application of Artificial Intelligence Technology in Imaging Diagnosis of Pulmonary Nodules: Progress, Challenges and Prospects

1. 引言

1.1. 肺结节的定义和早期诊断的重要性

肺结节是指直径小于3 cm的圆形或不规则的肺内病变，可以是良性或恶性的。肺结节是肺癌的重要征兆，早期发现和诊断对于提高肺癌患者的生存率具有重要意义。流行病学调查显示，我国肺癌发病率和死亡率呈持续上升趋势，已跃居恶性肿瘤之首[1]；2022年全国恶性肿瘤新发病例约为482.47万，其中肺癌仍然是最常见恶性肿瘤，新发病例约为106.06万；2022年全国恶性肿瘤死亡病例约为257.42万，而肺癌位居我国恶性肿瘤死亡之首，约为73.33万[2]。研究表明，早期诊断并及时治疗可将肺癌患者的5年生存率提高到70%以上[3]。因此，如何实现肺结节的早期诊断一直是胸部影像学领域的研究热点。

1.2. 传统肺结节诊断方法的局限性

传统的肺结节诊断主要依赖医生的经验和影像学特征，如结节大小、形状、密度、强化方式等。然而，这种方法存在一定的局限性。首先，不同医生的诊断经验和水平差异较大，导致诊断结果的主观性和不确定性较高。有研究指出，即使是经验丰富的放射科医生，其肺结节诊断的敏感性也只有75%左右[4]。其次，肺部CT图像中结节的大小、形状、密度等特征变化多样，增加了诊断的难度。微小实性结节、磨玻璃结节等非典型病变更是容易被漏诊。此外，传统方法难以处理大规模的医学影像数据，效率较低。随着低剂量CT筛查的推广，影像数据量急剧增加，传统诊断方法难以满足日益增长的诊断需求。

1.3. 人工智能技术在医学影像领域的应用

近年来，以深度学习为代表的人工智能技术取得了快速发展，在计算机视觉、自然语言处理等领域取得了显著成果。与传统机器学习方法相比，深度学习具有强大的特征学习和表示能力，能够直接从原始数据中学习层次化的特征表示，在图像分类、目标检测等任务上取得了超越人类的性能[5]。

医学影像作为一种典型的视觉数据，与人工智能技术有着天然的联系。将人工智能技术应用于医学影像分析，有望克服传统方法的局限性，实现更加精准、高效的疾病诊断。目前，人工智能技术已经在医学影像的各个领域得到广泛应用，如病变检测、分割、分类等[6]。在眼科、皮肤科、病理学等领域，人工智能辅助诊断系统已经达到甚至超过了人类专家的水平[7]。在肺部影像领域，人工智能技术也展现了广阔的应用前景，涌现出一系列基于深度学习的肺结节检测、分类和恶性程度预测方法。

2. 人工智能在肺结节影像学诊断中的应用进展

2.1. 基于深度学习的肺结节检测

肺结节检测是肺结节诊断的第一步，旨在从CT图像中自动识别出可疑的肺结节区域。传统的肺结节检测方法主要基于手工设计的特征，如形状、密度、纹理等，存在特征表达能力不足的问题，难以应对肺结节的多样性和复杂性。

近年来，基于深度学习的肺结节检测方法受到广泛关注。与传统方法相比，深度学习方法能够自动学习层次化的特征表示，具有更强的特征表达和分类能力。Setio等[8]提出了一种基于多视角深度残差网络的肺结节检测方法，通过融合三个正交视角的特征，有效提高了检测精度。在LUNA16公开数据集上，该方法取得了95.1%的敏感性和1.0个/扫描的假阳性率。Dou等[9]提出了一种基于三维卷积神经网络的肺结节检测方法，通过引入注意力机制和硬阈值采样策略，进一步提高了检测性能。在LUNA16数据集上，该方法取得了98.2%的敏感性和0.125个/扫描的假阳性率，刷新了当时的最佳结果。

然而，这些方法大多基于自然图像领域预训练的二维网络，难以充分利用CT图像的三维空间信息。为了克服这一问题，近期研究开始探索三维深度学习方法。Zhu等[10]提出了一种基于三维Faster R-CNN的肺结节检测方法，通过引入三维锚框机制和双路径特征融合，进一步提高了检测精度和效率。在LUNA16数据集上，该方法取得了95.8%的敏感性和1.17个/扫描的假阳性率。

2.2. 基于深度学习的肺结节分类

肺结节分类旨在判断检出的肺结节是良性还是恶性。准确的良恶性判断对于制定治疗方案至关重要。传统的肺结节分类方法主要基于人工提取的影像学特征和临床指标，如结节大小、形状、密度、强化方式等，存在特征表达能力不足和分类性能不稳定的问题。

基于深度学习的方法可以自动学习分类所需的特征表达，显著提高了分类性能。Shen等[11]提出了一种基于多尺度三维卷积神经网络的肺结节分类方法，通过融合不同尺度的特征，有效提高了分类精度。在LIDC-IDRI公开数据集上，该方法取得了87.1%的分类准确率，显著优于传统方法。Xie等[12]提出了一种基于双路径网络和转移学习的肺结节分类方法，通过引入注意力机制和转移学习策略，进一步提高了分类性能。在LIDC-IDRI数据集上，该方法取得了91.6%的分类准确率，接近人类专家水平。

然而，这些方法大多基于单一的CT影像特征，忽略了其他临床指标的重要性。为了进一步提高分类性能，研究人员开始探索多模态深度学习方法，融合影像学特征和临床指标。Han等[13]提出了一种基于多模态深度学习的肺结节分类方法，通过融合CT影像特征和临床指标(如年龄、性别、吸烟史等)，显著提高了分类性能。在LIDC-IDRI数据集上，该方法取得了92.3%的分类准确率，超过了单模态方法。

2.3. 基于深度学习的肺结节恶性程度预测

恶性程度预测旨在判断恶性肺结节的恶性程度，为制定个性化治疗方案提供参考。传统的恶性程度预测方法主要基于影像学特征和临床指标，如结节大小、形状、密度、强化方式、肿瘤标志物等，存在主观性强和预测性能不稳定的问题。

基于深度学习的方法可以自动学习预测所需的特征表达，显著提高了预测性能。Wang等[14]提出了一种基于注意力机制的三维卷积神经网络，通过引入注意力机制和多任务学习策略，有效提高了恶性程度预测的性能。在自建数据集上，该方法取得了85.6%的预测准确率，显著优于传统方法。Shen等[15]提出了一种基于图卷积神经网络的肺结节恶性程度预测方法，通过建模结节内部的拓扑结构，进一步提高了预测精度。在LIDC-IDRI数据集上，该方法取得了89.1%的预测准确率，超过了传统图像特征方法。

然而，这些方法大多基于有限的病例数据训练，模型的泛化能力有待进一步验证。为了提高模型的鲁棒性，研究人员开始探索数据增强和迁移学习等策略。Zhao等[16]提出了一种基于迁移学习的肺结节恶性程度预测方法，通过迁移自然图像分类任务的预训练模型，显著提高了模型的泛化能力。在自建数据集上，该方法取得了87.9%的预测准确率，且在小样本场景下表现稳定。

3. 人工智能在肺结节影像学诊断中面临的挑战

3.1. 数据标注不足

深度学习方法的性能很大程度上依赖于大规模高质量地标注数据。然而，医学影像数据的标注需要大量的人力和时间成本，且需要专业的医学知识。目前，可用于训练深度学习模型的肺结节影像数据集规模仍然有限，严重制约了深度学习方法的性能提升。以LIDC-IDRI数据集为例，虽然该数据集包含1018例患者的CT影像，但每例患者只有4名放射科医生的标注结果，标注质量参差不齐，难以满足深度学习模型的训练需求。

为了缓解数据标注不足的问题，研究人员提出了一系列解决方案。一种思路是利用无监督和半监督学习方法，从大量未标注数据中挖掘有用信息，减少对标注数据的依赖。例如，Zhang等[17]提出了一种基于对比学习的无监督特征表示方法，通过最大化相似样本的特征一致性，学习到鲁棒的结节特征表示。在LUNA16数据集上，该方法在只使用10%标注数据的情况下，就取得了与监督学习方法相当的检测性能。

3.2. 模型泛化能力有限

由于不同医院、不同设备采集的医学影像数据在图像质量、分辨率等方面存在较大差异，导致在一个数据集上训练的模型在另一个数据集上的性能往往会有所下降。这种现象在医学影像领域尤为常见，严重制约了深度学习模型的临床应用。以肺结节检测为例，不同CT设备的扫描参数、重建算法等差异会导致结节在图像中的表现形式发生改变，使得在特定设备上训练的模型难以迁移到其他设备上。

为了提高深度学习模型的泛化能力，研究人员提出了一系列解决方案。一种思路是利用领域自适应等迁移学习方法，缩小不同领域数据的分布差异，提高模型的跨领域性能。例如，Huang等[18]提出了一种基于对抗学习的领域自适应方法，通过最小化源域和目标域特征的分布差异，使得在源域数据上训练的模型能够更好地适应目标域数据。在LUNA16数据集上，该方法将模型的泛化误差降低了50%。

3.3. 可解释性不足

深度学习模型因其复杂的网络结构而被称为“黑盒模型”，其决策过程缺乏透明性和可解释性。在医学诊断领域，模型的可解释性对于临床决策至关重要。医生需要了解模型得出诊断结果的依据，以评估其可信度和合理性。然而，现有的深度学习模型大多只能给出诊断结果，而无法给出明确的诊断依据，这在很大程度上限制了其在临床实践中的应用。

为了提高深度学习模型的可解释性，研究人员提出了一系列解决方案。一种思路是利用可视化和特征属性等方法，解释模型关注的区域和特征。例如，Gao等[19]提出了一种基于类激活图的肺结节分类解释方法，通过可视化模型在做出诊断决策时关注的区域，帮助医生理解模型的诊断依据。

4. 人工智能在肺结节影像学诊断中的发展展望

4.1. 多模态信息融合

除了CT影像数据外，临床诊断还需要考虑患者的其他医学影像数据(如PET、MRI等)、临床指标、基因组学数据、病理学数据等。将这些异构数据进行融合，有望进一步提高人工智能辅助诊断的性能。然而，如何有效地融合这些异构数据仍然是一个具有挑战性的问题，需要探索更加智能的数据融合方法。一种可能的思路是利用多模态深度学习和跨模态表示学习等技术，从不同模态数据中学习一致的特征表示，实现无缝的数据融合[20]。另一种思路是利用知识图谱和因果推理等技术，显式地建模不同数据之间的语义关联和因果关系，引导数据融合过程。

4.2. 数据共享与联邦学习

为了克服数据标注不足和模型泛化能力差的问题，需要促进不同机构之间的数据共享和协作。然而，由于医疗数据的隐私性和安全性要求，直接共享原始数据往往存在困难。联邦学习是一种在不共享原始数据的前提下实现多方协作训练的机器学习范式，通过加密通信和差分隐私等技术来保护数据隐私[21]。联邦学习是在全局模型聚合过程中，通过准确率阈值来筛选出本地模型，并由中心服务器用筛选后模型的准确率计算相应的聚合权重，从而对全局模型进行聚合，使分类较佳的模型参与全局模型的构建，达到缓解多中心数据非独立同分布的问题(Nin-IIL)；将联邦学习应用于医学影像分析，有望在保护患者隐私的同时，实现更大规模的数据聚合和模型训练[22]。例如，Chen等[23]提出了一种基于联邦学习的肺结节检测方法，通过在多个医疗机构之间协作训练模型，在不共享原始数据的情况下，将检测性能提高了5个百分点。

4.3. 知识引导的深度学习

为了提高深度学习模型的可解释性，需要探索知识引导的深度学习方法。通过将医学领域知识显式地融入深度学习模型，使模型具备一定的推理和解释能力。图神经网络是一种很有潜力的知识引导深度学习方法，通过建模医学知识图谱，可以增强模型的可解释性[24]。

5. 结论与展望

人工智能技术在肺结节影像学诊断中展现了广阔的应用前景，有望为早期诊断和个性化治疗带来新的突破。当前，基于深度学习的肺结节检测、分类和恶性程度预测方法不断取得进展，性能不断提升，逐步接近甚至超过人类专家的水平。然而，人工智能在肺结节诊断中仍然面临数据标注不足、模型泛化能力差、可解释性不足等诸多挑战。未来，需要在多模态信息融合、数据共享与联邦学习、知识引导的深度学习等方面寻求突破，推动人工智能在肺结节诊断领域的创新发展。

基金项目

陕西省西安市科技计划项目(2024YXYJ0004)；陕西省西安市英才计划菁英项目(XAYC210062)；陕西省西安市科技计划项目(2021ZD04)；陕西省西安市科技计划项目(23YXYJ0061)。

NOTES

*通讯作者。