简介:摘要目的评估基于18F-FDG PET/CT图像的影像组学融合特征结合极端梯度提升(XGBoost)机器学习模型在乳腺癌人表皮生长因子受体2(HER2)表达状态预测中的价值。方法回顾性分析2012年1月至2019年12月于天津医科大学肿瘤医院行18F-FDG PET/CT检查的210例原发性乳腺癌患者[均为女性;年龄52(46,60)岁;HER2阳性95例,HER2阴性115例],采用Python 3.7.1软件从HER2阳性组及HER2阴性组分别随机抽取70%作为训练集[147例,其中HER2阳性67例,年龄52(46,60)岁;HER2阴性80例,年龄55(45,62)岁],30%作为测试集[63例,其中HER2阳性28例,年龄54(43,65)岁;HER2阴性35例,年龄52(45,61)岁]。在CT和PET图像上进行肿瘤分割后,分别提取CT、PET影像组学特征,经后处理获得PET/CT融合特征(包括PET/CT拼接特征和PET/CT平均特征)。建立支持向量机(SVM)模型和XGBoost机器学习模型,输入经特征筛选后保留的特征,用于预测乳腺癌原发灶中HER2的表达状态,并用ROC曲线对模型的预测效能进行评估。采用Delong检验分析不同模型及组学特征的预测效能,并绘制预测效能最高的机器学习模型的校准曲线。结果与SVM模型比较,XGBoost模型在输入CT特征、PET特征、PET/CT拼接特征和PET/CT平均特征时均有更佳的预测效能(z值:2.26~3.54, P值:0.016~0.040)。在XGBoost机器学习模型中,PET/CT平均特征预测乳腺癌HER2表达状态的ROC AUC为0.83(95% CI:0.73~0.93),优于CT特征[0.75(95% CI:0.63~0.88);z=3.57,P=0.027]、PET特征[0.73(95% CI:0.60~0.86);z=2.64,P=0.034]及PET/CT拼接特征[0.74(95% CI:0.60~0.87);z=2.49,P=0.037]。结论基于PET/CT影像组学融合特征建立的XGBoost机器学习模型有望用于乳腺癌患者HER2表达状态的预测。
简介:摘要目的评估基于18F-氟脱氧葡萄糖(FDG) PET/CT图像建立的多元影像组学模型对乳腺癌原发灶人表皮生长因子受体2(HER-2)表达状态的预测价值。方法回顾性分析2010年1月1日至2019年12月31日于天津医科大学肿瘤医院行18F-FDG PET/CT检查的273例女性乳腺癌患者的临床和影像学资料,年龄26~78(51.8±10.8)岁。根据乳腺癌原发灶HER-2表达状态的不同将患者分为HER-2阳性组和HER-2阴性组,比较2组患者的临床特征和PET/CT代谢参数的差异。勾画原发灶的感兴趣区,提取所有影像组学特征并建立基于PET/CT图像的影像组学特征模型,将样本中70%的患者作为训练集,剩余30%的患者作为测试集,采用受试者工作特征曲线比较PET/CT代谢参数及影像组学模型对乳腺癌原发灶HER-2表达状态的预测能力,采用十折交叉验证计算预测模型的平均性能。采用Wilcoxon秩和检验比较组间各PET代谢参数是否存在差异。计数资料的比较采用χ2检验,计量资料的比较采用两独立样本t检验和Mann-Whitney U秩和检验。结果HER-2阳性组患者106例、阴性组患者167例。HER-2阴性组患者合并腋下淋巴结转移的比例较HER-2阳性组患者高[85.03%(80/106)对75.47%(142/167)],且差异有统计学意义(χ2=3.900,P<0.05)。除腋下淋巴结转移情况外,2组患者的年龄、病理学类型及肿瘤分期间的差异均无统计学意义(t=-0.028,χ2=5.429、1.891,均P>0.05)。2组患者的PET代谢参数最大标准化摄取值、平均标准化摄取值、标准化摄取值峰值、肿瘤代谢体积、病灶糖酵解总量之间的差异均无统计学意义(Z=-1.583~-0.064,均P>0.05)。最终筛选出具有较好预测价值的37个影像组学特征建立组学特征模型,其中,PET影像组学参数8个、CT影像组学参数29个。在训练集中,影像组学特征模型曲线下面积(AUC)、准确率、灵敏度和特异度分别为0.913(95% CI:0.871~0.954)、0.882(95%CI:0.832~0.922)、0.849(95%CI:0.759~0.910)和0.910(95%CI:0.841~0.952);在测试集中,影像组学特征模型AUC、准确率、灵敏度和特异度分别为0.820(95%CI:0.723~0.918)、0.830(95%CI:0.738~0.900)、0.875(95%CI:0.701~0.959)和0.807(95%CI:0.683~0.892);经十折交叉验证后,影像组学模型的AUC、准确率、灵敏度、特异度的均值分别为0.818、0.847、0.908、0.764。结论相较于传统的PET代谢参数,基于18F-FDG PET/CT图像建立的多元影像组学模型对乳腺癌原发灶HER-2表达状态有较好的预测价值,有助于临床医师筛选曲妥珠单抗受试人群,改善患者预后。