学科分类
/ 25
500 个结果
  • 简介:摘要目的探讨基于随机森林模型分析内脏脂肪等级的相关指标。方法本研究为横断面研究,选取2021年3—9月在黑龙江省医院健康管理中心进行体检的医院职工(包括在职职工和退休职工)共617例的各项实验室指标以及体成分分析各项指标,按照2∶1的比例将样本分为训练集(411例)和测试集(206例),模型共纳入预测变量110个,使用训练集数据进行随机森林模型构建,测试集数据进行模型验证,选择最优节点数和决策树数目,对构建模型的预测性能进行评价,同时选取重要性在前10位的相对重要因子进行下一步的研究。按内脏脂肪等级,对617名研究对象再次进行分组:内脏脂肪等级正常组和内脏脂肪等级偏高组,进一步分析前10位相对重要因子在组间的差异。结果随机森林模型的最优节点数为39、决策树数目为300。模型在测试集上的准确率为83.3%、精确率为73.9%、灵敏度为89.4%、特异度为78.7%,其受试者工作特征曲线下面积为0.881(95%CI:0.832~0.931)。模型中前10位相对重要因子依次为:体重指数、性别、年龄、尿酸、红细胞计数、单核细胞计数、C肽、癌胚抗原、糖化血红蛋白、谷氨酰转肽酶。内脏脂肪等级偏高组的体重指数、年龄、尿酸、红细胞计数、单核细胞计数、C肽、癌胚抗原、糖化血红蛋白、谷氨酰转肽酶水平均高于内脏脂肪等级正常组(均P<0.05);内脏脂肪等级偏高的发生率男性大于女性(P<0.05)。结论本研究构建的内脏脂肪等级的随机森林预测模型表现良好,内脏脂肪与机体肝功能、胰岛功能、免疫功能的改变均有关系。

  • 标签: 内脏脂肪等级 体重指数 随机森林预测模型 机器学习模型
  • 简介:摘要传统的生存分析方法虽在生物医学领域已有广泛应用,但需满足一些前提假设。随机生存森林方法可克服这一弱点。本文以美国梅奥诊所的肝脏原发性胆汁肝硬化的数据为例,从随机生存森林的原理、建模步骤、实例演示和适用性讨论等方面进行阐述,以期为读者进行生存分析提供新的思路和方法。

  • 标签: 模型,统计学 人工智能 随机生存森林
  • 简介:摘要:为提高数据分析的准确度以及速度,引入卷积神经网络DL算法,开展对数据识别方法设计研究。分析对比实验结果得出,设计方法的识别结果相似度更高,识别误差更小,可以实现对数据识别准确度的提升。基于卷积结构的信号调制识别神经网络的识别性能受信号调制类型种类限制。

  • 标签:  深度调制识别 迁移学习 卷积神经网络 数据 DL算法
  • 简介:摘要:为提高数据分析的准确度以及速度,引入卷积神经网络DL算法,开展对数据识别方法设计研究。分析对比实验结果得出,设计方法的识别结果相似度更高,识别误差更小,可以实现对数据识别准确度的提升。基于卷积结构的信号调制识别神经网络的识别性能受信号调制类型种类限制。

  • 标签:  深度调制识别 迁移学习 卷积神经网络 数据 DL算法
  • 简介:

  • 标签:
  • 简介:摘要目的建立随机森林模型预测急性心肌梗死(acute myocardial infarction,AMI)患者并发急性肾损伤(acute kidney injury, AKI)。方法使用温州医科大学附属东阳医院大数据平台,筛选出1 363例患AMI的病例,确定30个变量后,统计分析样本临床特点,将样本划分为75%的训练集建立随机森林模型,以及25%的测试集进行验证,使用R语言进行数据的筛选及模型的建立。最后根据特异性、敏感性、准确性、受试者特征工作特征曲线(relative operating characteristic curve, ROC曲线)等来评估模型性能,同时与其他三种常用的机器学习算法(神经网络,朴素贝叶斯,支持向量机)的模型性能进行比较。结果AMI合并AKI的患者的人口学信息、心血管疾病的危险因素、入院时的生命体征、实验室检查等与未合并急性肾损伤的患者存在差异性。模型评估后得出测试集的ROC曲线下面积为0.893,特异度为0.791,灵敏度为0.866,其中入院首次肌酐、首次尿素、D-二聚体、年龄、机械通气是其最重要的影响因素。在本研究中,多种机器学习算法比较后,随机森林模型较有优势。结论建立的随机森林模型具有帮助预测AMI并发AKI的潜力。

  • 标签: 急性心肌梗死 急性肾损伤 随机森林 预测模型
  • 作者: 庞海玉 朱兰 徐涛 刘青 李兆艾 龚健 王玉玲 汪俊涛 夏志军 郎景和
  • 学科: 医药卫生 >
  • 创建时间:2021-09-05
  • 出处:《中华妇产科杂志》 2021年第08期
  • 机构:中国医学科学院北京协和医学院北京协和医院医学科学研究中心 疑难重症及罕见病国家重点实验室 100730,中国医学科学院北京协和医学院北京协和医院妇产科 国家妇产疾病临床研究中心 100730,中国医学科学院基础医学研究所北京协和医学院基础学院流行病及统计学系 100005,甘肃省妇幼保健院妇产科,兰州 730050,山西省儿童医院 山西省妇幼保健院妇产科,太原 030013,南京医科大学附属无锡妇幼保健院妇产科 214001,广东省佛山市妇幼保健院妇产科 528000,贵阳市妇幼保健院妇产科 550001,中国医科大学附属盛京医院妇产科,沈阳 110004
  • 简介:摘要目的应用机器学习中的随机森林算法探讨中国女性尿失禁(UI)发病的危险因素,并评价各危险因素对于UI发病的预测效果。方法采用多阶段分层整群抽样,在全国调查55 477例成年女性UI情况;基线调查于2014年2月至2016年1月完成,2018年6月至12月电话随访;最终纳入基线无UI且随访UI诊断指标数据完整的对象。采用欠采样技术,按照1∶1的比例从随访时未发生UI的人群中随机抽取与随访对新发UI相等人数作为对照,将这些调查对象的研究数据按照7∶3的比例随机分成训练集和测试集。将单因素分析中P<0.2的候选变量,带入训练集并采用随机森林算法建模,在训练集筛选UI发病的危险因素,根据重要性对危险因素排序,并在测试集中验证。结果共30 658例(55.26%,30 658/55 477)完成随访,中位随访时间3.7年。纳入本研究的24 985例基线无UI的对象中,随访调查UI发病人数为1 757例(7.03%,1 757/24 985),其中压力性UI 1 117例(4.47%,1 117/24 985),急迫性UI 243例(0.97%,243/24 985),混合性UI 397例(1.59%,397/24 985)。随机森林模型固定特征数量为2个、决策树数量为300棵时,平均袋外估计误差率最低,此时模型分类准确率为64.3%,敏感度为64.2%,特异度为64.4%。根据Gini系数平均下降量,得到预测UI发病的前10位影响因素依次为:年龄、分娩次数、分娩方式、体质指数(BMI)、绝经状态、糖尿病史、教育程度、盆腔手术史、城乡分布、婚姻状况。结论应用机器学习中的随机森林算法,从复杂的多因素中识别出预测中国女性UI发病的前10位影响因素,依次为:年龄、分娩次数、分娩方式、BMI、绝经状态、糖尿病史、教育程度、盆腔手术史、城乡分布、婚姻状况。

  • 标签: 尿失禁 危险因素 随机分配 算法 机器学习 纵向研究 随机森林
  • 简介:摘要目的基于随机森林算法构建儿童重症腺病毒肺炎(severe adenovirus pneumonia,SAP)的临床预测模型,并对其进行验证。方法采用观察性研究设计,回顾性分析2019年1月至2021年1月天津市儿童医院收治的542例腺病毒肺炎患儿的临床、实验室及影像学资料。将研究对象随机分为训练集和验证集(8∶2)。训练集通过随机森林算法筛选SAP的预测因子建立预测模型,并通过列线图将预测模型可视化表达。在验证集中利用受试者工作特征(ROC)曲线和敏感性、特异性、误判率、混淆矩阵对其进行验证。结果训练集患儿439例,其中重症型187例(42.60%),验证集患儿103例,其中重症型44例(42.71%)。训练集中单核细胞百分比(M%)、PLT、AST、IL-6、热峰、肺部大片炎性实变、肺部斑片状阴影是影响SAP的独立预测因子。模型区分度验证发现训练集和验证集的ROC曲线下面积分别为0.95(95%CI:0.92~0.98)和0.92(95%CI:0.82~0.99)。训练集的准确度、灵敏度、特异性、阳性预测值和阴性预测值分别为0.994、1.000、0.987、0.998、1.000;验证集的分别为0.752、0.990、0.514、0.945、0.857。结论该预测模型具有较好的判别能力,早期的临床及血液学指标有助于提高儿童SAP的识别和筛选,具有一定的临床价值。

  • 标签: 儿童 腺病毒 重症肺炎 预测模型 随机森林
  • 简介:摘要目的探讨家庭早期的风险因素与青少年内化问题的关系。方法随机选取746名青少年进行家庭早期风险因素的评估和内化问题的调查。采用Welch's ANOVA检验和事后两两比较分析三个不同风险因素水平在内化问题得分上的差异。采用独立样本t检验比较经历风险因素种类≥5种与<5种青少年的内化问题得分,以及Pearson相关分析对个体经历家庭风险因素的个数与内化问题得分进行相关性检验。利用随机森林回归分析检验影响内化问题的变量重要性(variable importance,VI)。结果不同水平的家庭早期风险因素在焦虑抑郁因子、退缩因子上的得分差异均有统计学意义(均P<0.05);经历5种以上(包括5种)风险因素青少年的焦虑抑郁[(7.7±3.5)分]、退缩因子[(8.8±4.0)分]以及躯体因子[(4.1±3.7)分]显著高于经历5种风险因素以下青少年的得分[(5.5±3.8)分,(6.7±3.4)分,(2.6±3.6)分](t=7.25,7.54,6.51,均P<0.01);个体经历风险因素的累积个数分别与焦虑抑郁、退缩因子、躯体因子得分呈正相关(r=0.29,0.30,0.26,均P<0.01);父母婚姻关系和家庭成员的健康状况是焦虑抑郁(VI=0.84,P=0.002;VI=0.56,P=0.022)、退缩因子(VI=0.58,P=0.013;VI=0.89,P=0.001)以及躯体因子(VI=0.58,P=0.014;VI=0.65,P= 0.011)的重要变量。结论父母婚姻关系及家庭成员的健康状况是影响内化问题的"特异性"因素,同时经历风险水平越高,个体出现内化问题的可能性越大。

  • 标签: 风险因素 内化问题 青少年 随机森林回归
  • 简介:摘要目的探讨基于随机森林的参数响应图(PRM)定量参数对肺功能的预测价值。方法回顾分析2018年8月至2019年12月在上海长征医院接受胸部三大疾病筛查的受试者615例。根据肺功能指标[第1秒用力呼气容积与用力肺活量的比值(FEV1/FVC)及第1秒用力呼气容积占预计值的百分比(FEV1%)]分为正常组、高危组及慢性阻塞性肺疾病(COPD)组。小气道CT定量参数主要为PRM参数,包括全肺、左肺、右肺及5个肺叶的肺体积、功能小气道疾病体积(PRMVfSAD)、肺气肿体积(PRMVEmph)、正常部分肺体积(PRMVNormal)、未分类部分肺体积(PRMVUncategorized)及后四者体积占全肺的百分比(%)。采用单因素方差分析或Kruskal-Wallis H检验3组间基本临床特征(年龄、性别、身高、体质量)、肺功能参数和小气道CT定量参数的差异;采用Spearman检验评价PRM参数与肺功能参数的相关性。最后构建基于PRM联合4个基本临床特征的随机森林回归模型,预测肺功能。结果3组间全肺PRM参数差异均有统计学意义(P<0.001)。CT定量参数PRMVEmph、PRMVEmph%、PRMVNormal%与FEV1/FVC呈中度相关(P<0.001),全肺体积、PRMVNormal、PRMVUncategorized及PRMVUncategorized%与FVC呈强或中度正相关(P<0.001),余PRM参数与肺功能参数呈弱或极弱相关。基于以上参数建立预测FEV1/FVC的随机森林模型和预测FEV1%的随机森林模型。预测FEV1/FVC的随机森林模型预测FEV1/FVC与实际值在训练集中R2=0.864,验证集中R2=0.749;预测FEV1%的随机森林模型预测FEV1%与实际值在训练集中R2=0.888,验证集中R2=0.792。验证集中,随机森林FEV1%预测模型对正常组及高危组分类的灵敏度为0.85(34/40),特异度为0.90(65/72),准确度为0.88(99/112);随机森林FEV1/FVC预测模型对非COPD患者及COPD患者分类的灵敏度0.89(8/9),特异度1.00(112/112),准确度0.99(120/121);两个模型联合对COPD组内[慢性阻塞性肺疾病全球倡议(GOLD)Ⅰ、GOLD Ⅱ、GOLD Ⅲ+Ⅳ]分类的准确度为0.44。结论小气道CT定量参数PRM可区分正常人群、高危及COPD人群;基于PRM参数结合临床特征的联合回归预测模型,对正常组及高危组、非COPD及COPD组的预测效果良好,进而实现一次CT扫描能够完成对功能小气道和肺功能的一次性评估。

  • 标签: 肺疾病,慢性阻塞性 体层摄影术,X线计算机 肺功能检测 随机森林
  • 简介:摘要目的构建预测电离辐射诱导DNA双链断裂(DSB)水平的随机森林分类模型,初步研究DSB在基因组中的分布规律。方法将GRCh38参考基因组分为50 kb的片段,根据MCF-7细胞的测序数据把片段分为电离辐射诱导的DSB低水平和高水平区域,以8种表观遗传学特征作为输入,随机将数据集的2/3列为训练集,1/3列为测试集,构建含100棵决策树的随机森林分类模型。分析分类模型中表观遗传学的特征重要性,展示这些标记在不同DSB水平区域的富集差异。结果随机森林分类模型在测试集上预测的准确率为99.4%,精准率为98.9%,召回率为99.9%,受试者操作特征曲线下面积为0.994。8个特征中H3K36me3和DNase标记的重要性最高,富集分析表明DSB高水平区域的这两类标记明显高于DSB低水平区域。结论以表观遗传学数据作为特征输入,随机森林分类模型可在50 kb基因组区域上准确预测电离辐射诱导的DSB水平,分析表明这些DSB可能主要分布在基因组中转录活跃的部位。

  • 标签: 电离辐射 DNA双链断裂 随机森林 分类模型 表观遗传学
  • 简介:摘要目的探讨血液检测指标及其变化情况与空腹血糖受损的关系,进行风险预测研究。方法以2018年1月至2019年12月在山东第一医科大学第一附属医院健康管理中心进行健康体检、2次体检时间间隔6个月及以上、第1年进行健康体检时无糖尿病史且空腹血糖正常者为研究对象,以第2年空腹血糖水平为因变量,分别以第1年一般检查和血液检查指标、第2年一般检查和血液检查指标的变化量为自变量构建模型。首先使用随机森林模型筛选自变量,然后拟合Logistic回归模型计算自变量的效应值。结果共纳入研究对象4 416人,经1年随访,基线血糖正常者中3.45%(133/3 851)发展为糖尿病前期血糖,0.42%(16/3 851)发展为糖尿病血糖。利用血液检测指标预测1年后空腹血糖变化情况的灵敏度为67.1%,特异度为100.0%,年龄偏大(OR值为1.024,95%CI 1.014~1.035)、收缩压偏高(OR值为1.018,95%CI 1.011~1.025)、体质量指数偏高(OR值为1.079,95%CI 1.036~1.125)、尿酸偏高(OR值为1.003,95%CI 1.002~1.005)、谷氨酰转肽酶偏高(OR值为1.006,95%CI 1.003~1.010)、肌酐偏低(OR值为0.971,95%CI 0.957~0.985)、AST/ALT偏低(OR值为0.614,95%CI 0.411~0.917)、估算的肾小球滤过率偏低(OR值为0.972,95%CI 0.958~0.988)者1年后出现空腹血糖受损的可能性大。利用血液检测指标的变化情况预测1年后空腹血糖变化情况的灵敏度为65.2%,特异度为99.7%,1年内三酰甘油升高(OR值为1.152,95%CI 1.057~1.257)、碱性磷酸酶升高(OR值为1.021,95%CI 1.012~1.030)、白蛋白升高(OR值为1.087,95%CI 1.029~1.148)、AST升高(OR值为1.006,95%CI 1.003~1.009)、体质量增加(OR值为1.049,95%CI 1.019~1.081)者出现空腹血糖受损的可能性大。结论年龄偏大、收缩压偏高、体质量指数偏高、尿酸偏高、谷氨酰转肽酶偏高、肌酐偏低、AST/ALT偏低、估算的肾小球滤过率偏低者1年后出现空腹血糖受损的可能性大,1年内三酰甘油升高、碱性磷酸酶升高、白蛋白升高、AST升高、体质量增加者出现空腹血糖受损的可能性大。当体检者出现以上情况时,应注意监测血糖,及时进行干预,以阻止或延缓糖尿病的发生发展。

  • 标签: 空腹血糖 血液检测 风险预测 随机森林
  • 简介:摘要目的探讨血液检测指标及其变化情况与空腹血糖受损的关系,进行风险预测研究。方法以2018年1月至2019年12月在山东第一医科大学第一附属医院健康管理中心进行健康体检、2次体检时间间隔6个月及以上、第1年进行健康体检时无糖尿病史且空腹血糖正常者为研究对象,以第2年空腹血糖水平为因变量,分别以第1年一般检查和血液检查指标、第2年一般检查和血液检查指标的变化量为自变量构建模型。首先使用随机森林模型筛选自变量,然后拟合Logistic回归模型计算自变量的效应值。结果共纳入研究对象4 416人,经1年随访,基线血糖正常者中3.45%(133/3 851)发展为糖尿病前期血糖,0.42%(16/3 851)发展为糖尿病血糖。利用血液检测指标预测1年后空腹血糖变化情况的灵敏度为67.1%,特异度为100.0%,年龄偏大(OR值为1.024,95%CI 1.014~1.035)、收缩压偏高(OR值为1.018,95%CI 1.011~1.025)、体质量指数偏高(OR值为1.079,95%CI 1.036~1.125)、尿酸偏高(OR值为1.003,95%CI 1.002~1.005)、谷氨酰转肽酶偏高(OR值为1.006,95%CI 1.003~1.010)、肌酐偏低(OR值为0.971,95%CI 0.957~0.985)、AST/ALT偏低(OR值为0.614,95%CI 0.411~0.917)、估算的肾小球滤过率偏低(OR值为0.972,95%CI 0.958~0.988)者1年后出现空腹血糖受损的可能性大。利用血液检测指标的变化情况预测1年后空腹血糖变化情况的灵敏度为65.2%,特异度为99.7%,1年内三酰甘油升高(OR值为1.152,95%CI 1.057~1.257)、碱性磷酸酶升高(OR值为1.021,95%CI 1.012~1.030)、白蛋白升高(OR值为1.087,95%CI 1.029~1.148)、AST升高(OR值为1.006,95%CI 1.003~1.009)、体质量增加(OR值为1.049,95%CI 1.019~1.081)者出现空腹血糖受损的可能性大。结论年龄偏大、收缩压偏高、体质量指数偏高、尿酸偏高、谷氨酰转肽酶偏高、肌酐偏低、AST/ALT偏低、估算的肾小球滤过率偏低者1年后出现空腹血糖受损的可能性大,1年内三酰甘油升高、碱性磷酸酶升高、白蛋白升高、AST升高、体质量增加者出现空腹血糖受损的可能性大。当体检者出现以上情况时,应注意监测血糖,及时进行干预,以阻止或延缓糖尿病的发生发展。

  • 标签: 空腹血糖 血液检测 风险预测 随机森林
  • 简介:摘要目的探讨基于影像的膝关节定量结构特征是否可以预测膝关节的症状,并评估这些特征在几种不同的膝关节症状中的预测价值。材料与方法首先从骨性关节炎公用数据库(osteoarthritis initiative,OAI)的美国国立卫生研究院生物标志物联盟基金会项目(Foundation for the National Institutes of Health,FNIH)纳入了551个志愿者数据,并将他们分为训练集和测试集。然后提取其中5个影像特征数据集中153个结构影像特征以及西安大略大学和麦克马斯特大学骨性关节炎指数(Western Ontario and McMaster Universities,WOMAC),分别用于评估膝关节的结构特征和症状。接下来使用相关性分析和最小冗余最大相关性(minimum-redundancy maximum-relevance,mRMR)方法进行特征选择。最后,构建了基于随机森林(random forest,RF)回归的预测器模型,并评估了他们预测膝关节的症状评分的能力。结果影响膝关节不同症状(物理功能、疼痛、僵硬)的结构影像特征主要集中在股骨和胫骨的内侧位置。基于这些特征建立的预测器模型表现出了良好的可行性和准确性:4个预测器的R方值在训练和测试集中均高于0.9。疼痛和僵硬预测器的平均绝对误差(mean absolute errors,MAEs)和均方误差(mean squared errors,MSEs)在训练和测试集中均被限制在0.5以下,物理功能预测的MAEs和MSEs在训练/测试集分别为0.5296/2.2727、0.4449/7.8488,总分预测的MAEs和MSEs在训练/测试集分别为1.4167/3.3498、3.1651/16.3974。结论所建立的随机森林模型可以有效地用于预测和评估膝关节症状,筛选出来的结构特征可以在将来用作膝关节症状评估和指导治疗潜在的影像学标志物。

  • 标签: 膝关节炎 症状预测 结构影像特征 随机森林模型 生物标志物
  • 简介:摘要目的基于MRI平扫T2WI和增强T1WI的影像组学特征值,探讨机器学习模型随机森林(random forest,RF)对子宫内膜癌肌层浸润深度预测价值。材料与方法回顾性分析行盆腔MRI平扫及增强检查并经手术病理证实为子宫内膜癌患者的影像资料114例(ⅠA期86例,ⅠB期28例),以4∶1的比例通过分层抽样的方法分为训练集和测试集。采用ITK-SNAP软件分别在矢状面平扫T2WI图像及多期增强T1WI图像第二时相进行手动逐层勾画ROI,分别对T2WI和增强T1WI数据集进行影像组学特征值提取(https://github.com/Radiomics/pyradiomics),并对随机森林模型进行训练和测试(http://scikit-learn.org/),采用ROC曲线评价预测效能。结果基于平扫T2WI图像特征值建立的RF模型预测子宫内膜癌肌层浸润深度在测试集的曲线下面积(AUC)为0.938,其准确度、敏感度、特异度分别为91.3%、87.5%、93.3%,模型中重要性排名前3位的特征分别为形状平坦度(shape flatness,SF)、灰度级带矩阵区域方差(GLSZM zone variance,GLSZM-ZV)、灰度级长矩阵运行方差(GLRLM run variance,GLRLM-RV);基于增强T1WI图像建立的RF模型在测试集的AUC为0.818,准确度、敏感度、特异度分别为81.8%、100%、75.0%,模型中重要性排名前3位的特征分别为SF、灰度相关矩阵高灰度依赖程度(GLDM large dependence high gray level emphasis,GLDM-LDHGLE)、灰度共生矩阵相关性(GLCM correlation)。结论基于MRI影像组学的随机森林模型在预测子宫内膜癌肌层浸润深度中具有较大应用潜力,其中基于平扫T2WI图像建立模型较增强T1WI显示出更大的诊断价值。

  • 标签: 子宫内膜肿瘤 肌层浸润 影像组学 磁共振成像
  • 简介:【摘要】:

  • 标签:
  • 简介:摘要目的构建随机森林模型并探讨其对乳腺癌新辅助化疗病理完全缓解(pCR)的预测价值。方法回顾性分析2010年1月至2021年10月沧州市中心医院142例新辅助化疗后行保乳术或改良根治术的原发性乳腺癌患者的临床病理资料。根据患者是否获得pCR(乳腺和腋窝淋巴结组织学无浸润性癌残留)分为pCR组与非pCR组,比较两组患者临床病理特征的差异。通过logistic回归分析新辅助化疗pCR的危险因素,应用R软件随机森林函数构建随机森林模型,应用随机森林算法的基尼指数对变量进行重要性排序。以pCR为金标准,通过受试者工作特征(ROC)曲线评价随机森林模型预测新辅助化疗pCR的效能。结果全组患者新辅助化疗pCR率为16.20%(23/142)。pCR组中肿瘤长径≤ 5 cm、腋窝淋巴结阴性、人表皮生长因子受体2(HER2)阴性、Ki-67阳性指数>20%、组织学分级2级及新辅助治疗方案包括靶向治疗患者比例均高于非pCR组,差异均有统计学意义(均P<0.05)。单因素logistic回归分析显示,肿瘤长径、腋窝淋巴结、HER2、Ki-67、组织学分级及新辅助治疗方案均与pCR相关(均P<0.05)。多因素logistic回归分析显示,肿瘤长径>5 cm(OR=5.85,95% CI 1.28~26.67,P=0.022)、腋窝淋巴结阳性(OR=11.22,95% CI 1.84~68.42,P=0.009)、HER2阳性(OR=7.35,95% CI 1.45~37.26,P=0.016)、Ki-67阳性指数≤20%(OR=1.03,95% CI 1.01~1.06,P=0.017)、组织学分级3级(OR=7.37,95% CI 1.24~43.86,P=0.028)及非靶向治疗(靶向治疗比非靶向治疗:OR=0.02,95% CI 0.00~0.25,P=0.003)均为pCR的独立危险因素。随机森林算法分析显示,pCR危险因素重要性依次为Ki-67低表达、腋窝淋巴结阳性、肿瘤长径>5 cm、HER2阳性、非靶向治疗及组织学分级3级。ROC曲线分析显示,随机森林模型预测pCR的曲线下面积为0.84(95% CI 0.74~0.93),当最佳临界值为0.88时,灵敏度为87.0%,特异度为72.3%。结论Ki-67低表达、腋窝淋巴结阳性、肿瘤长径>5 cm、HER2阳性、非靶向治疗及组织学分级3级为乳腺癌新辅助化疗pCR的危险因素,以此建立的随机森林模型有助于预测乳腺癌新辅助化疗pCR。

  • 标签: 乳腺肿瘤 肿瘤辅助疗法 病理完全缓解 随机森林
  • 简介:从科学的观点来看,临床试验中有足够样本含量的随机化、对照、盲法临床试验是最理想的研究设计.不采用随机化和盲法设计,当临床医生对某种疗法偏爱或厌恶时,会有意无意地影响试验效应的判定,甚至剔除某些对象或改变对象处理安排,给试验带来偏倚,难以保证结果的可靠性.目前临床试验中最多采用的是多中心、随机、对照、平行、双盲试验.随机化保证了研究对象有相同的机会进入处理组或对照组,但并不是所有的随机化方案都是等效的.有些研究人员自称的随机方案其实并不是真正的随机,不能有效地控制偏倚.一些时有报道使用的交替分配、表格号码(奇或偶)或出生日期等分配方法,貌似随机,可能并未真正随机.这些方法会潜在影响分配决定,因为负责分配病人的调研人员可能会事先知道下一个处理是什么,从而决定病人是否进入研究或根据自己对处理的偏好来分配病人;另外,这样的分配有时还会和病人自身的某些规律暗合,因而这些都不是真正的随机方案.洗牌、抛硬币等方法尽管是随机的,但不能检查或重复.使用随机数字表、随机排列表是很好的方法,因为表中的数字是经过随机产生后定下来的,因此可以重复,但较为麻烦,对于样本量较大的临床试验,也很费时.在目前计算机应用非常普及的情况下,用统计软件中的随机化功能,事先给出种子数,进行随机化,既简单,又可重复,符合随机化要求,应予提倡.本文介绍用SAS系统实现临床试验随机化的方法,并兼论随机化试验的盲法及伦理问题.

  • 标签: 随机化临床试验 SAS系统 随机方案设计