欢迎你们前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~前端
本文由 云加社区技术沙龙 发表于 云+社区专栏演讲嘉宾:江铖,腾讯觅影高级研究员。多年以来一直从事计算机视觉相关的研究。加入腾讯之后,负责腾讯觅影乳腺癌AI方向的研发,参与研发的项目在多家大型三甲医院落地。数据库
你们好,今天很高兴能给你们带来这方面的报告。正如你们所看到的,社会平均年龄在逐年增加,你们对健康的意识也是愈来愈高,与此同时伴随着AI技术的发展,AI医疗方向就成为了互联网领域的一大研究热点,腾讯在这方面也是作了很大的努力,在这周四广州举办的互联网+会议上咱们正式对外发布了咱们的AI乳腺系统。做为该系统的研发人员之一我有幸见证了这个项目从无到有以及一次一次迭代的过程,因此但愿在今天的会场上可以跟你们分享一下咱们整个团队的经验。安全
选择乳腺癌这个研究方向做为咱们工做的开始主要是有两方面的缘由。第一方面是对于女性来讲乳腺癌是全部肿瘤当中发病率最高的一种,它的发病率大概在16%-17%之间,严重危害女性的健康。第二点是由于乳腺癌它虽然发病率很高,可是它的治愈率是比较高的,若是能在较早期发现的话它的治愈可能性是很是高的。对于美国来讲目前五年的生存率是在89%,而中国在这方面只有83%。缘由主要是中国人口基数过多,相对来讲有经验的看片医生较为缺少,这就产生一个供需的矛盾。目前应用AI技术就是为了缓解这个矛盾,可以最大限度地帮助到患者跟医生。微信
对于乳腺的诊断先来作一些基础知识的了解。对乳腺来讲诊断方式一般有如下五种,前四种是大部分医院采用的方式,首先对于一个来体检或者是以为有异常的人,一般会对他先进行一个X光拍照,拍照以后对他进行一个诊断。影像科的医生读片以后做出判断,若是发现有不能肯定的地方他们会建议进一步作超声和磁共振。若是这两个作下来依然有可疑的状况,可能就会建议作病理。病理能确认一个患者是否真的患有乳腺癌。在做出定性判断以后若是真的有,再断定恶性的程度是多高,给出一个打分。网络
而后在这个基础上还会对恶性肿瘤的亚型进行分类,对不一样的亚型能够采用不一样的治疗方案。近些年基因方面的研究也是比较热的,众所周知若是家族当中有人患有乳腺癌的话,其家族成员患上乳腺癌的几率相对其余人来讲就会高一些,目前已经有研究证实有一种叫作BRCA的基因,携带这样基因的女性患乳腺癌的几率要远远高于日常人。因此经过这个基因能够帮助咱们肯定高发人群,而且可以有助于咱们制订个性化的治疗方案。框架
从上面能够看到对乳腺癌的诊断是有很是多的模态的,咱们的终极目标是可以把这些模态有机地结合起来,造成一个完整的总体,提升对乳腺癌的诊疗技术。咱们最先开始的研究方向是钼靶,由于钼靶它是使用最为普遍,而且最为有效的一种方式。,咱们如今对于钼靶的研究成果已经落地了三十多家三甲医院,而且已经初步获得了一些应用,也得到了一些反馈。在病理和磁共振方面咱们也取得了阶段性的成果,而在超声方向咱们目前是刚刚开始。学习
下面就以咱们作得相对完整的一个钼靶项目来开始今天的技术分享。这个乳腺钼靶主要实现了三方面的功能,第一方面实现了疑似病灶的定位,可以在给定的钼靶图上将两大潜在的恶性灶准确的标定出来。这样能够辅助医生从而减轻医生读片的压力,另外一方面能够下降医生的漏诊率。第二是判断病灶恶性的几率,并在此基础上对整个单侧乳房都作出进一步的断定。最后就是前面提到的这些分析的基础上结合一些图像处理的方式提取乳腺的特征,并生成它的影像报告。ui
咱们来看一下这三方面的功能是怎么实现的呢?咱们主要采用了下面这样一种技术框架,这个框架主要包含三层内容,在这个框架的前端主要是提供了对于钼靶影像的前处理层。中间的核心模块是咱们的AI学习模型,第三层在是这两个模型的基础上经过医生的反馈,对前两层进行动态更新。下面我将每个部分跟你们具体的讲一讲。spa
首先在前处理模块,目前主要经过归一化、迁移学习方面的方法来实现对于不一样X光厂商设备适配的这个过程。在进行了设备适配后,咱们会对其进ROI提取。在前端处理以后就到了核心部分:学习模型因为乳腺钼靶的特殊性,咱们没有办法直接用目前市面上已经有的神经网络来解决这个问题。因而咱们就单独设计了这个模型。它有四大优势,第一个优势就是相对于传统的网络的单图输入,TMuNet模型采起了四图( MLO-CC位)输入,左乳有两张,右乳有两张,由于X光拍摄的角度有CC位和MLO位两种方式。CC位是水平方式的拍摄,MLO的话是一个侧斜位的拍摄方式。经过左右乳进行对比,能够极大提高诊断的精准度。尽量地解决同影异病和同病异影的问题。设计
第二点咱们采用了一种多尺度网络,一般在天然图像处理中图片在输入网络以前,会对其进行缩放,缩放以后再输入固定的网络。因为医学影像中的病灶对于同一个形态不一样的尺寸,可能意味着良恶性的不一样,若是单纯的作缩放有可能作出不一致的判断,因此采起了经过网络结构的设计来适配图片的方式。
第三点就是渐进式的网络构建,这种方式有点类似于咱们大脑进行学习的过程,对于一个复杂的问题,它不是一次性解决的,它是把问题分解成若干个相对简单的问题而后一层一层去解答。
这个网络也是基于这样的思想,首先咱们会使用一个浅层网络对局部的病灶,好比说肿块、钙化进行病灶的分类。在此基础上逐步加深网络层次,实现对单幅图片的一个诊断,而后咱们再进一步的对网络进行加深,从而实现四张图片诊断的功能。因此说咱们的训练是一层一层的,咱们的网络也是逐渐加深的过程。
第四点是自步学习的训练方式。人脑它在学习新的知识的时候一般是由易到难的,因此在样本训练的过程当中,并非一次性把全部的样本都投入网络进行训练。咱们将这些样本按从易到难顺序分红了多个类别,而后咱们在训练的过程中也按由易到难的顺序逐步地把样本加进去,对模型进行训练。实验代表经过这样的过程,模型能够达到一个最好的效果。
在采用前面四种这种方式获得了这样一个基础模型以后,咱们还会根据医生的反馈以及一些新接入医院新的数据对咱们的模型进行迁移学习,并作动态更新。在工程实践的过程中咱们总结发现AI见过的疑难病例的数量和种类很大程度上决定了这个AI系统的上限。所以咱们很是注重咱们这个数据集的运营。咱们数据集会按期的从数据库和线上数据当中挖掘有价值的疑难病例,对其进行标注。同时对于这其中的一部分咱们会请专家三甲医院特别知名的专家让他们来跟咱们进行讨论,利用病理或者其余数据进行交叉确认。将这些数据加入到咱们训练样本以后咱们的模型就能够远远的超过那些没有这些数据的网络。
而后最终咱们的这个模型达到了下面的精度,肿块探测方面能够在0.2误检率的状况下达到92%的敏感度。钙化检测精度更高,对于良恶性分类能够达到87%的敏感度和96%的特异度。
除了这些内容以外咱们在病理和磁共振方向也开展了研究,目前已经取得了一些阶段性的成果。在超声方向咱们也是投入了人力的,目前咱们对超声还处在数据的准备过程中。固然就像开始所提到的咱们的终极目标是把这几种多模态的数据有机地结合起来,为患者跟医生提供咱们力所能及的帮助。这就是我今天的报告,谢谢你们!
Q&A
Q:我想问一下四张图是怎么放到网络里的?还有一个问题就是MLO位和CC位是否对同一个病灶作了匹配?
A:咱们是作了的。而后放进去的话主要是经过网络的增广来解决的,这方面里面具体的细节的话如今还不太方便透露。
Q:还有一个问题就是钙化点的标记和肿块的标记是分开标记的仍是?
A:这个是须要分开的,由于他们的特征是不同的。根据咱们的经验来讲对于钙化分类的话,它是比肿块更容易的。
问答
相关阅读
安全报告 | 2018上半年互联网恶意爬虫分析:从全景视角看爬虫与反爬虫
此文已由做者受权腾讯云+社区发布,原文连接:https://cloud.tencent.com/dev...
欢迎你们前往腾讯云+社区或关注云加社区微信公众号(QcloudCommunity),第一时间获取更多海量技术实践干货哦~
海量技术实践经验,尽在云加社区!