中国防痨杂志 ›› 2024, Vol. 46 ›› Issue (9): 1042-1049.doi: 10.19982/j.issn.1000-6621.20240095
仲玲珊1, 王莉1, 张硕1, 李楠1, 杨晴媛1, 丁文龙1, 陈星枝2, 黄陈翠2, 邢志珩1()
Zhong Lingshan1, Wang Li1, Zhang Shuo1, Li Nan1, Yang Qingyuan1, Ding Wenlong1, Chen Xingzhi2, Huang Chencui2, Xing Zhiheng1()
摘要:
目的: 探索基于胸部CT图像的结合放射组学特征和语义特征的机器学习模型,以准确诊断非结核分枝杆菌肺病和肺结核。方法: 回顾性收集天津市海河医院2017年1月至2020年12月确诊的120例非结核分枝杆菌肺病和120例肺结核患者的胸部CT图像,分层随机抽取168例(70%)作为训练集,72例(30%)作为测试集。收集西安市胸科医院确诊的25例非结核分枝杆菌肺病和25例肺结核患者的胸部CT图像,作为外部验证集。从全部胸部CT图像中提取12种语义特征和2107个放射组学特征,其中放射组学特征通过特征降维保留40个。采用支持向量机(support vector machines, SVM)算法建立了三个机器学习分类模型,分别是语义模型、放射组学模型、结合放射组学和语义特征的放射组学-语义模型。通过受试者工作特征曲线及曲线下面积对机器学习模型的诊断性能进行评估,用DeLong检验比较三种模型之间差异的统计学意义。结果: 在测试集上,放射组学-语义模型、放射组学模型和语义模型的曲线下面积分别为0.9853、0.9282、0.7901。语义模型和放射组学-语义模型,语义模型和放射组学模型之间差异均有统计学意义(Z=2.759,P=0.006;Z=2.230,P=0.026);放射组学-语义模型和放射组学模型之间差异无统计学意义(Z=0.761,P=0.502)。在外部验证集上,放射组学-语义模型、放射组学模型和语义模型的曲线下面积分别为0.9216、0.9024和0.7624。放射组学-语义模型和语义模型之间差异有统计学意义(Z=2.126,P=0.034);放射组学-语义模型和放射组学模型之间差异无统计学意义(Z=0.368,P=0.713)。结论: 与语义模型相比,结合放射组学和语义特征的机器学习模型在区分肺结核和非结核分枝杆菌肺病方面具有良好的诊断效率和临床应用价值,尽管与放射组学模型相比,其性能改进并不显著。
中图分类号: