在乳腺癌领域,机器学习与已有风险评分的工具,谁更优呢?今天我们就来看看作者是怎么实现两种不同工具性能的比较。
一、背景介绍1.1乳腺癌概况:乳腺癌是影响全球妇女的最常见的恶性肿瘤,是癌症死亡的第五大原因,该病仍然是一个公共卫生问题。大部分乳腺癌发生在少数高危人群中。可以通过筛查和预防选择来降低发病率和死亡率,目前,早期发现是降低乳腺癌风险的最佳选择。
1.2已有预测乳腺癌风险模型的不足:这些模型的分辨能力,即ROC曲线下面积(AU-ROC)在0.53-0.64之间。尽管有许多模型,但是由于模型分辨的准确性和适用性有限,在常规临床实践和筛查方案中没有纳入一致的模式。
BOADICEA模型(theBreastandOvarianAnalysisofDiseaseIncidenceandCarrierEstimationAlgorithm)是是一种风险预测模型,用于计算携带乳腺癌或卵巢癌易感基因(如BRCA1、BRCA2、PALB2、CHEK2和ATM等)的概率,以及估计未来发展为乳腺癌或者卵巢癌的风险。它是基于关于癌症家族史、高危基因变异筛查、肿瘤病理和基本人口统计学因素(如出生年份和国家)等来进行预测。BCRAT(theBreastCancerRiskAssessmentTool)
IBIS模型(theInternationalBreastInterventionStudymodel)
1.3机器学习(ML)算法:
机器学习(ML)算法为标准预测模型提供了一种替代方法,可以解决当前的局限性并提高乳腺癌预测模型的准确性。有一些ML技术已经开发并应用于乳腺癌的预测和预后,并证明ML方法的应用可以提高对癌症易感性、复发和生存模型的预测精度。机器学习(ML)算法在乳腺癌风险预测和筛查实践中的临床应用尚不清楚。目前的研究,尤其在使用新的ML预测模型的潜在临床后果方面,很少检验ML技术的临床效用。1.4瑞士的监测筛查乳腺癌方案:年,瑞士癌症联盟采用了英国NICE临床指南,该指南建议根据女性的风险分类进行钼靶检查和核磁共振检查。根据不同的家族史情况,指南将女性分为中(17%≤一生风险30%)和高(一生风险≥30%)乳腺癌风险。
年龄超过50岁是进入以人群为基础的筛查项目所考虑的唯一风险因素。然而,大约25%的乳腺癌是由年轻女性诊断的。钼靶作为一种筛查工具对年轻女性的效果较差,因为年轻女性的乳房组织更可能致密,降低了这个年龄段常规钼靶检查的效率。这导致诊断延迟,发病率和死亡率增加。在个体化医疗的时代,基于个体乳腺癌风险的筛查策略可能会提高乳腺钼靶检查的利与弊比,并提高筛查方案的效率。1.5本文研究主要内容概要:本次研究使用了三种ML算法和BOADICEA模型计算了样本人群乳腺癌的终生风险,并根据瑞士的监测方案,比较了ML算法与BOADICEA模型的诊断准确性、分类以及对乳腺钼靶筛查的影响。
二、研究方法乳腺癌风险分类整个队列的配对流程图:
机器学习和BOADICEA模型中用到的变量一致:为了公平地比较不同的风险预测模型,ML算法的输入使用与BOADICEA模型相同的风险因素。
基于之前关于方法在识别、跟踪和利用具有相同数据结构的相似样本显著特征方面的可靠性、有效性和性能的报告,本次研究选择了三种ML算法,即马尔可夫链蒙特卡洛广义线性混合模型(MCMCGLMM)、自适应增强(ADA)和随机森林(RF)。
本次研究使用了这三种不同的ML算法和BOADICEA模型来估计来医院的癌遗传科个家庭的,个个体的一生乳腺癌风险。用AU-ROC(受试者工作特征曲线的曲线下面积)评估算法的性能。
研究人员对年龄在20-80岁之间的名无乳腺癌患者进行了风险重分比较。
根据瑞士的监测方案,采用以下方法来评估乳腺癌终身风险:17%为低风险组,≥17%和30%为中度风险组,≥30%为高危组。统计分析使用频率、百分比、平均值和标准差来描述名无乳腺癌妇女的人口统计学特征和临床特征。根据瑞士的监测方案,计算了中高危组钼靶检查监测分类的差异。
三、研究内容及结果3.1ML-ADA模型性能最优表1给出了三种ML算法与BOADICEA模型的性能比较:使用ADA、MCMCGLMM和RF的预测准确率分别为88.9%、85.1%和84.3%,而使用BOADICEA模型的预测准确率分别为63.9%,准确率提高了约20-25%。
由于ADA方法的准确性在三种ML算法中最高,所以在后续分析中选用ADA作为机器学习方法的代表。
图2显示了BOADICEA模型和ADA模型(ADA是表现最好的ML方法)之间的ROC曲线。
由此得出:使用相同的危险因素,ML技术的准确性优于瑞士临床样本的BOADICEA模型。
3.2本次研究的非乳腺癌女性的特征表2显示了瑞士临床样本的人口学和临床特征:
在36,名无乳腺癌的女性中,有人(7.24%)被诊断为其他类型的癌症。在全部样本中,只有少数无乳腺癌的女性(名;1.3%)检测了BRCA1和/或BRCA2种系致病变异,包括完整的和靶向的检测。这些女性中的大多数都进行了有针对性的基因检测,即寻找此前在该家族中已经确认的致病变异基因。3.3BOADICEA模型与ML算法分类比较根据瑞士临床指南中的乳腺癌终生风险划分,与使用BOADICEA模型作为参考标准相比,ML-ADA划分的高危组增加了例。此外,ML-ADA与BOADICEA模型相比低风险组减少了例。BOADICEA模型在低风险组和中危险组中与ML-ADA的一致性为~60%,但是在高危组与ML-ADA的一致性为87.95%。ML-ADA将名妇女(26.55%)分为高风险组,名妇女(8.78%)分为低风险组。将表3与瑞士监测方案相结合时,可以确定另外名(14.83%)50岁以下的女性需要早期筛查。3.4对钼靶筛查乳腺癌的临床影响表4展示了应用BOADICEA和ML-ADA模型以及基于瑞士监测方案的钼靶监测的总体数量差异:
对于40-59岁的女性,ML-ADA将另外名女性归入中等风险组,建议每年进行乳腺钼靶检查。ML-ADA将另外名女性归入高危组,其中名年龄在30岁至59岁之间,建议每年做一次乳腺钼靶检查;名年龄在60岁以上的女性,建议两年做一次乳腺钼靶检查。四、讨论4.1BOADICEA模型与ML算法的比较此次研究,主要目的是为了调查与BOADICEA模型相比,ML算法是否能够提高乳腺癌的预测精度。上述研究结果清楚地证明了ML算法有更好的预测能力。
当考虑到瑞士监测方案时,两种评估方法的主要不一致主要集中在高危组。
考虑到ML方法获得了更高的鉴别准确性,当使用BOADICEA模型时,一些妇女的乳腺癌风险会被低估,而十一分之一的妇女的风险会被高估。
与ML-ADA相比,使用BOADICEA模型时,约有10-15%的30-80岁的女性筛查不足。
所有三种ML方法在区分癌症病例和非癌症妇女方面都优于BOADICEA模型,并且在使用与BOADICEA模型完全相同的危险因素的情况下,其预测精度提高了20-25%。
4.2关于瑞士国家乳腺癌筛查方案:与其他国家筛查方案一致,瑞士国家乳腺癌筛查方案仅根据年龄,从50岁开始。这种方法将忽略40-49岁的乳腺癌中高危妇女和30-49岁的高危女性。以风险为基础的乳腺癌控制和预防战略的制定和实施具有重要的公共卫生影响。
常见的风险估计模型,如BOADICEA模型,目前被用于临床实践,为调整筛查提供依据,即增加乳腺钼靶筛查的频率,并在较年轻的年龄开始筛查。然而,低识别精度极大地限制了这些模型的临床应用。
在人群水平上,ML算法已经达到了高灵敏度,可以用于识别高危妇女,并划分判断是否需要更早开始乳腺癌筛查。
在预防性干预的决定方面:如预防性乳房切除术或使用他莫西芬作为降低风险的药物,是受女性个体化乳腺癌风险评估的影响。与BOADICEA模型相比,使用ML模型时,三分之一的女性被分为不同的风险类别,这可能导致不同的预防干预措施。
当用ML算法重新对女性进行分类时,使用17%和30%的临界值会导致不同风险组之间的相对较大比例的女性发生变化。所以分类可能应该基于另外的临界值。
4.3使用风险预测模型存在一些障碍首先,每种风险预测模型使用不同的风险因素。在发展每个模型时所使用的风险因素限制了其在更广泛人群中的适用性和有效性。
其次,现有的收集和评估临床数据的基础设施限制了风险预测模型的发展及其在更广泛人群中的通用性。
ML方法有可能达到更好的准确性,并可以纳入不同类型的信息,包括乳腺钼靶,家族史,种系遗传数据和临床因素。但是,目前还没有综合系统来纳入来自这些不同来源的数据,例如筛查方案、医疗咨询和医疗记录。
为了建立一个可用于加强国家筛查计划的风险预测模型,应评估筛查实践中可获得的风险因素的有用性,例如乳腺密度和既往乳腺良性疾病。基于每个风险因素的预测能力,以及在筛选设置中收集相关数据的可行性等来开发一个支持有效临床决策的综合模型。然而,投入到这个有前景的新分析方法的资源有限。
4.4本次研究优势和局限性4.4.1优势研究结果可靠:
本次研究使用了有限数量的已建立的乳腺癌风险因素,且所选的ML模型相对不复杂,这有助于减轻乳腺癌ML算法的“黑箱”特性。样本量大,数据完整度高,准确性高。该研究已经评估了此次模型的内部有效性,和以往的相关研究相比,这项研究中重现了类似的准确性表现。已经使用内部统计交叉验证对外部有效性进行了部分评估,这一个过程中,每一次迭代都依赖于单独和独立的训练和测试数据集。作为一种有前景的分析方法,即使从筛选实践中获得的信息有限,研究ML的潜在临床效用是十分重要的。
4.4.2局限性研究方法的性能评估与k-Fold交叉验证过程在同一数据集,这可能导致乐观的模型性能。然而,与其他常用的方法(例如简单的训练/测试分割法)相比,k-Fold交叉验证过程通常会导致对模型能力的有部分偏差或不太乐观的估计。
此外,该研究使用了回顾性的横断面数据,这限制了ML算法生成5年或10年风险估计的能力。使用ML算法分析前瞻性纵向数据可能揭示临床决策支持的额外含义。
4.5总结全面的乳腺癌风险预测模型使人们能够识别并针对高危妇女,同时减少对低风险妇女的干预。临床应用的乳腺癌风险预测模型判别精度较低(0.53-0.64)。机器学习(ML)为标准预测建模提供了一种替代方法,可以解决当前的局限性并提高这些工具的准确性。
未来的研究可以通过合并其他临床数据,如生活方式、药物、乳房图像、良性乳房疾病和共病的确切组织学,来提高ML算法的性能。
与本研究类似的思路,该研究团队还研究了在个性化乳腺癌风险预测中,ML技术与BCRAT和BOADICEA模型之间的对比[ref2],得出结论:
使用ML算法对患有和不患有乳腺癌的妇女进行分类的准确性有显著的提高。ML算法不仅限于特定数量的风险因素,而且可以灵活地改变或合并其他风险因素。ML方法提供了实现改进和更精确的风险估计的令人兴奋的前景。五、参考文献:1.MingC,ViassoloV,Probst-HenschN,DinovID,ChappuisPO,KatapodiMC.Machinelearning-basedlifetimebreastcancerriskreclassification
推荐文章
热点文章