新冠肺炎疫情在海外迎来了爆发之势,而检测手段的繁琐和设备的短缺,也成了疫情防控过程当中的拦路虎。html
许多媒体都报道,检测不力是多国没法有效追踪疫情,致使病例迅速激增的一个缘由。算法
近日两所知名的高校,卡内基梅隆大学(CMU)和剑桥大学,不约而同地使用了一种新的方式:经过 AI 系统分析声音信息,来检测被 COVID-19 感染的风险。安全
在卡内基梅隆大学给出的测试器 COVID Voice Detector 中,须要完成几种声音的录制,仅需几分钟便可获得感染风险的结果。机器学习
进入网站注册后,须要进入我的状况的填写。其中涉及的信息包括人种,年龄,健康情况,是否确诊或确诊过等信息。学习
上述信息填写完毕后,须要录制咳嗽、英文元音的发音,数字和字母表朗读等语音信息。测试
而模型通过了确诊者和正常测试者的一些数据的训练,能够对新输入的声音进行分类的匹配。网站
最终会返回一个分数,代表所录制的声音,和收集到的 COVID-19 患者数据相比,感染特征相符合的程度。spa
为了让系统的判断尽量准确,必须拥有足够多的训练数据,并且还要涵盖多元化的信息,研究人员正在倡议更多的志愿者参与进来。3d
此外,他们称系统具有可扩展性,如声音来自其余呼吸系统疾病的人,算法就可学到该类疾病的声音特征。htm
测试器地址:
https://cvd.lti.cmu.edu/cvd/
发稿前访问该网站,提示由于在更新和维护的缘由暂时关闭,相关负责人表示,有望在本周末再次上线。
和卡内基梅隆大学相似,剑桥大学也推出了用声音检测 COVID-19 的项目。但稍有不一样的是,剑桥大学仅仅仍是只是收集数据,还不提供检测的结果。
系统收集数据的方式相差不大,须要填写基本资料和医疗信息,并经过手机麦克风采集语音信息做为训练样本。
一样地,系统也会调查用户的身体健康状况,好比是否发烧、是否感染过等信息。需录制的项目有呼气声、咳嗽声和阅读文本的声音。
项目负责人 Cecilia Mascolo 教授解释说,因为该项研究的大型数据集很是少,为了提供更好的算法以用于早期检测,须要收集到足够多的数据量。
他还表示到,数据量累计以后,即使没有足够冠状病毒阳性病例,还能够找到与其余呼吸道疾病有关的信息。
该项目的最终目标是,开发出可自动检测疾病的机器学习算法,以可推广使用的检测 App 来呈现。
项目地址:
https://www.covid-19-sounds.o...
两个项目彼此独立,但使用的方式和原理拥有着一些共性。而对于项目的具体原理,双方却都没有给出太多信息。
卡内基梅隆大学的研究团队,曾长期致力于语音取证技术。他们认为人的声音,受到器官机构情况和健康程度的影响,能揭示生理,心理甚至医学数据。
受肺炎病毒感染的患者,肺部会发生一些病变,其呼吸模式等参数会受到影响,致使发出的声音出现一些异常特征,对算法而言是一个可以抓取的特色。
剑桥大学的团队,也是由多位专家、博士组成。在项目介绍中他们表示到,新冠肺炎做为一种呼吸系统疾病,感染疾病的人发出的声音会存在一些特征,包括声音,呼吸间隔和咳嗽声等。
虽然这种方式很新颖,但两个项目都处于初期阶段,在 BBC 的一篇报道中,还使用了「Teething problems」(出牙痛,指代初期困难)来代表此方案的困难。
不过在以前的研究中,用声音来诊断疾病的案例中,出现了一些成功的案例。
好比,成立于 2014 年的 ResApp Health,就专一使用机器学习算法来分析咳嗽声,来诊断和测量各类慢性和急性疾病的严重程度。目前取得了一些成果,可对哮喘,肺炎和毛细支气管炎等疾病进行判断。
另外一个叫 Sonde 的公司,在去年还得到了一项语音诊断的美国专利。他们开发的一个平台,经过感测和分析语音中的细微变化,可从讲话中判断患者的健康情况,辅助医生进行诊断抑郁症、痴呆症等病症。
用声音诊断 COVID-19 的项目,相比已经成熟的研究,除了时间紧迫以外,关于疾病的声音数据也少之又少,因此难度和挑战也不小。
对于两个项目来讲,研究没有通过 FDA 或 CDC 的批准,还不能用于正规的医学诊断。
现阶段的最大目的在于,呼吁更多人(包括确诊者和正常人)贡献本身的声音数据,以推进该研究项目的进展,进而去帮助对新冠等流行病的控制。
关于这些研究,也出现了是否会有效的争议。好比不一样地区疫情的程度不一样,会不会带来模型的分析偏见。而简单的语音录制,虽然方便但收集的语音信息,是否达到了科学分析的要求。
如今看来,关于系统的专业性和准确度,还须要等待后续的验证。在此以前,没人知道前方的道路,但另外一方面,这正是科学探索的魅力所在。