|
通过咳嗽和呼吸噪音诊病的谷歌AI
如果这种技术实现,将非常方便于远程诊断。其实通过粪便、气味、声音、面容、舌头图像和身体运动姿态等信息,诊断各种疾病是完全可能的。随着这些技术的发展,对于推动医疗智能化发展是非常重要的,也是非常值得我们期待的。
Google AI could soon use a person’s cough to diagnose disease (nature.com)
由谷歌科学家领导的一个团队开发了一种机器学习工具,可以通过评估咳嗽和呼吸等噪音来帮助检测和监测健康状况。人工智能(AI)系统1,在数百万个人类声音的音频片段上训练,有朝一日可能会被医生用来诊断包括 COVID-19 和结核病在内的疾病,并评估一个人的肺部功能。
这不是研究小组第一次探索使用声音作为疾病的生物标志物。这个概念在 COVID-19 大流行期间获得了关注,当时科学家发现可以通过一个人的咳嗽来检测呼吸道疾病2.
谷歌系统的新功能——称为健康声学表示(HeAR)——是它所训练的海量数据集,以及它可以微调以执行多项任务的事实。
研究人员本月早些时候在预印本中报告了该工具1尚未经过同行评审,现在判断HeAR是否会成为商业产品还为时过早。目前,该计划是让感兴趣的研究人员访问该模型,以便他们可以在自己的研究中使用它。“作为谷歌研究院的一部分,我们的目标是刺激这个新兴领域的创新,”谷歌在纽约市的产品经理Sujay Kakarmath说。
如何训练模型在这个领域开发的大多数人工智能工具都是在录音上训练的,例如咳嗽的录音,这些录音与发出声音的人的健康信息配对。例如,可以对剪辑进行标记,以表明该人在录制时患有支气管炎。该工具将声音的特征与数据标签相关联,这是一个称为监督学习的训练过程。
“在医学上,传统上,我们一直在使用大量的监督学习,这很好,因为你有临床验证,”坦帕南佛罗里达大学的喉科医生Yael Bensoussan说。“不利的一面是,它确实限制了你可以使用的数据集,因为那里缺乏带注释的数据集。
相反,谷歌研究人员使用了自我监督学习,它依赖于未标记的数据。通过自动化流程,他们从公开的YouTube视频中提取了超过3亿个咳嗽、呼吸、清嗓子和其他人类声音的短音片段。
每个剪辑都被转换为声音的视觉表示,称为频谱图。然后,研究人员屏蔽了频谱图的片段,以帮助模型学习预测缺失的部分。这类似于聊天机器人 ChatGPT 背后的大型语言模型在接受无数人类文本示例的训练后被教导预测句子中的下一个单词。使用这种方法,研究人员创建了他们所谓的基础模型,他们说该模型可以适用于许多任务。
高效的学习者就 HeAR 而言,谷歌团队对其进行了调整,以检测 COVID-19、结核病和人是否吸烟等特征。由于该模型是在如此广泛的人类声音上训练的,为了对其进行微调,研究人员只需要向它提供非常有限的带有这些疾病和特征的数据集。
在 0.5 表示性能不优于随机预测的模型和 1 表示每次都能做出准确预测的模型的量表上,HeAR 在 COVID-19 检测方面的得分分别为 0.645 和 0.710,具体取决于它测试的数据集——比在语音数据或一般音频上训练的现有模型性能更好。对于结核病,得分为0.739。
Kakarmath 说,原始训练数据如此多样化——音质和人源各不相同——这一事实也意味着结果是可推广的。
俄克拉荷马大学塔尔萨分校的工程师阿里·伊姆兰(Ali Imran)表示,谷歌使用的大量数据为这项研究提供了重要意义。“这让我们相信这是一个可靠的工具,”他说。
伊姆兰领导了一款名为 AI4COVID-19 的应用程序的开发,该应用程序在区分 COVID-19 咳嗽和其他类型的咳嗽方面显示出希望3.他的团队计划向美国食品和药物管理局(FDA)申请批准,以便该应用程序最终能够进入市场;他目前正在寻求资金进行必要的临床试验。到目前为止,还没有FDA批准的工具通过声音提供诊断。
Bensoussan说,健康声学或“音频组学”领域很有前途。“声学科学已经存在了几十年。不同的是,现在有了人工智能和机器学习,我们有能力同时收集和分析大量数据。她共同领导了一个研究联盟,专注于探索声音作为跟踪健康的生物标志物。
她说:“不仅在诊断方面,而且在筛查和监测方面都有巨大的潜力。“我们不能每周都重复扫描或活检。这就是为什么声音成为疾病监测中非常重要的生物标志物的原因,“她补充道。“它不是侵入性的,而且资源匮乏。”
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 00:13
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社