谷歌新模型提高肺癌筛查率:相关研究登上Nature Medicine

肺癌致死率高,且大部分发现即晚期。早期的低剂量CT筛查能够有效提升存活率,可是仅有少数病患接受了筛查,且低剂量CT筛查仍然存在问题,如较高的假阳性结果。今日,谷歌发布新研究,展现了AI能够诊断肺癌,可以帮助提高全世界不少病患的存活率,有助于早期肺癌CT筛查在全世界范围内的推广。算法

根据世界卫生组织,肺癌每一年形成 1700 万人死亡,是致死率最高的癌症(死亡率超过乳腺癌、前列腺癌和结直肠癌的总和),是全球第六大死因。尽管肺癌在全部癌症中存活率最低,但若是发现得早并及早干预是能够有更多治疗机会的。然而,统计数据显示,大部分肺癌到了晚期才被诊断出来。app

过去三十年,医生探索了不少方式来诊断肺癌高危人群。尽管低剂量 CT 筛查被证实可以下降肺癌死亡率,可是仍然存在一些问题致使不明确的诊断结果、后续没必要要治疗、医疗成本等等。框架

谷歌的最新研究性能

根据谷歌博客介绍,谷歌于 2017 年底开始探索如何使用 AI 解决一些挑战。研究者利用 3D 体建模的进展,结合来自谷歌合做伙伴(包括美国西北大学)的数据集,在建模肺癌预测方面取得了很大进步,为将来临床测试奠基了基础。谷歌的相关研究已发布在 Nature Medicine 上。学习

该研究所用数据集:测试

  • LUNA: https://luna16.grand-challenge.org/data/优化

  • LIDC: https://wiki.cancerimagingarchive.net/display/Public/LIDC-IDRIui

  • NLST: https://biometry.nci.nih.gov/cdas/learn/nlst/images/google

该研究中来自美国西北大学的数据集暂未公开。人工智能

放射科医生在一次 CT 扫描中一般须要查看数百张 2D 图像,而癌症是很微小也很难看到的。谷歌研究者建立了一个模型,该模型不只可以生成肺癌恶性肿瘤总体预测,还能够识别出肺部不易被察觉的恶性组织(肺结节)。该模型还能够将以前的扫描结果考虑在内,帮助预测肺癌风险,由于肺结节的增加速度有可能预示着有恶性肿瘤的存在。

总体建模框架图示。

在谷歌的这项研究中,研究者利用 45856 个去识别化的胸部 CT 扫描案例(其中一部分是癌症病例),这些案例来自美国国家肺癌筛查试验(National Lung Screening Trial, NLST)和美国西北大学的 NIH 研究数据集。研究者使用另外一个数据集进行验证,并将实验结果与六名美国认证放射科医生的诊断结果进行对比。

在使用单次 CT 扫描进行诊断时,谷歌的模型性能堪比甚至优于六名放射科医生。与没有辅助的放射科医生相比,该模型检测出的癌症病例多出 5%,且假阳性检查结果减小了 11% 以上。谷歌的方法得到了 94.4% 的 AUC(曲线下面积)。


该模型在完整 NLST 数据集上和在单独测试集上的结果。

下图展现了在仅使用当前 CT 扫描时,该模型与人类放射科医生的肺癌检测性能对比:

下图展现了,在使用当前和以前 CT 扫描时,该模型与人类放射科医生的肺癌检测性能对比:

对于无癌症史的无症状病患,该 AI 系统审查和检测出了潜在肺癌,而该病患先前被诊断为正常。

下一步计划

尽管肺癌筛查具备很大价值,但如今美国仅有 2-4% 的相关病患接受筛查。谷歌的这项研究展现了人工智能在提高肺癌筛查准确率和一致性方面的潜力,这将有助于加速在全球范围内推广肺癌筛查。

这些初步结果使人鼓舞,但后续研究将对临床实践中的影响和效果进行评估。研究者正与 Google Cloud Healthcare 和 Life Sciencecs 团队合做,并经过 Cloud Healthcare API 提供该模型,同时与全球合做伙伴进行早期接洽以继续其余的临床验证研究和部署。

论文:End-to-end lung cancer screening with three-dimensional deep learning on low-dose chest computed tomography

论文地址:www.nature.com/articles/s4…

2018 年,美国肺癌死亡人数约为 160000,是美国排名第一位的肿瘤死因。使用低剂量 CT 筛查进行肺癌扫描已被证明可以将死亡率下降 20–43%,低剂量 CT 筛查现已包含在美国筛查指南中。但仍然存在一些挑战,包括评估者差别可变性(inter-grader variability)以及较高的假阳性和假阴性率。

谷歌研究者提出了一种深度学习算法,利用病患当前和之前的 CT 来预测肺癌风险。他们提出的模型在 6716 个美国国家肺癌筛查试验病例上取得了当前最佳的效果(曲线下面积为 94.4%),并在包含 1139 个病例的独立临床验证集上得到了相似的性能。

研究者还进行了两项评估者研究。当之前的 CT 影像不可用时,模型效果优于全部六位放射科医生的诊断,将假阳性率下降 11%,假阴性率下降 5%。当之前的 CT 影像可用时,模型效果与放射科医生的诊断至关。这为利用计算机辅助和自动化来优化筛查过程提供了机会。目前绝大多数病患处于未接受筛查的状态,研究者认为深度学习模型有助于提高全球范围内肺癌的筛查准确率、一致性和推广。

原文连接: blog.google/technology/…
相关文章
相关标签/搜索