JOS的个人博客分享 http://blog.sciencenet.cn/u/JOS

博文

中国半导体十大研究进展候选推荐(2023-003)——基于智能人工喉的混合模态语音识别与交互新范式

已有 1282 次阅读 2023-3-2 10:33 |系统分类:论文交流

image.png

工作简介

         ——基于智能人工喉的混合模态语音识别与交互新范式


语音是人类交流的重要方式,但说话人健康状态(例如神经疾病、癌症、外伤等原因导致的声音障碍)和周围环境(噪音干扰、传播介质)往往会影响声音的传输和识别——这是一直以来困扰语音识别与交互的难题:非理想声源。具体形式为弱语音、非标准语音等;传输介质干扰。体现在外部噪声、传输衰减、介质空间多样性等方面。研究人员一直在改进语音识别和交互技术以应对微弱的声源或嘈杂的环境,现有的人类语音处理技术(HLP)普遍基于非接触式声学传感器采集的语音数据开发,尚未很好地利用喉部发声器官本身精细的机械信号。同时,目前尚无充分证据表明喉部肌肉运动模式和反映在体表发声器官振动中隐含着可识别的语音特征。


为深入挖掘喉部机械振动与可识别语音之间的内在联系,任天令教授团队于2017年首次研发出可感知喉部皮肤运动的第一代石墨烯人工喉,随后在第二代器件中优化了器件佩戴体验。但尚未验证人工喉用作语音识别功能是否完备。在前期工作基础上,任天令教授团队成员开创了一种基于智能可穿戴人工喉(AT)语音识别/交互新范式(图1)。


image.png

图1. 基于智能可穿戴人工喉的语音交互范式。


同商业麦克风和压电薄膜相比,人工喉对低频的肌肉运动、中频食管振动和高频声波信息敏感(图2)。由于与皮肤保持共形接触,人工喉能够获取高质量的原始语音与声源器官运动的混合模态信号,同时也具有抗噪声的语音感知能力(图2)。对声学信号和机械运动的混合模态感知使人工喉能够获得更低的语音基频信号(F0)(图3)。此外,该器件还可以通过热声效应实现声音播放功能。人工喉的制作过程简单,性能稳定,易于集成,为语音识别和交互提供了一种新的硬件平台。


image.png

图2. 人工喉器件语音感知性能。

image.png

图3. 人工喉器件与麦克风采集的语音信息标注和共振峰特征分析。


任天令教授团队利用人工智能模型,对人工喉感知的信号进行语音识别和合成,实现了对基本语音元素(音素、声调和词语)的高精度识别,以及对喉癌患者模糊语音的识别与再现,为声音障碍者的沟通和交互提供了一种创新的解决方案。实验结果表明,人工喉采集的混合模态语音信号可以识别基本语音元素(音素、音调和单词),平均准确率为99.05%。同时人工喉的抗噪声性能明显优于麦克风,在60 dB以上环境噪声下仍能保持识别能力。任天令教授研究团队进一步演示了其语音交互式应用。通过集成AI模型,人工喉能够识别一名喉切除术患者模糊说出的日常词汇,准确率超过90%。识别出的内容被合成为语音在人工喉上播放,可以初步恢复患者的语音交流能力。


image.png

图4. 使用智能可穿戴人工喉进行无声语音交互。

上述相关成果以“使用可穿戴人工喉的混合模态语音识别与交互”(Mixed-modality speech recognition and interaction using a wearable artificial throat)为题,于2023年2月24日在线发表在《自然·机器智能》(Nature Machine Intelligence)上。论文通讯作者为清华大学集成电路学院任天令教授、田禾副教授、杨轶副教授和上海交通大学医学院罗清泉教授,清华大学集成电路学院2019级博士生杨其晟、上海交通大学医学院2019级博士生金伟秋为共同第一作者。该项目得到了国家自然科学基金委、科技部、教育部霍英东基金、北京市自然基金委、清华大学国强研究院、清华大学佛山先进制造研究院、清华大学-丰田联合研究院、清华-华发建筑光电子技术联合研究院等项目的支持。



作者简介


image.png

通讯作者

任天令,清华大学信息科学技术学院副院长,教育部长江学者特聘教授,国家杰出青年基金获得者,博士生导师。


近年来,承担国家自然科学重点基金、国家重大科技专项、国家公益性行业科研专项、国家重大仪器专项、国家863计划、国家973计划等多项国家重要科技项目,做出一系列具有重要国际影响的创新学术成果。主要研究方向为智能微纳电子器件、芯片与系统,包括:智能传感器与智能集成系统,二维纳电子器件与芯片,柔性、可穿戴器件与系统,智能信息器件与系统技术等。在国内外重要学术期刊和会议发表论文600余篇,包括NatureNature ElectronicsNature CommunicationsScience AdvancesEnergy & Environmental ScienceAdvanced MaterialsACS NanoNano LettersBiosensors & BioelectronicsNanoscaleCarbonIEEE Electron Device LettersIEEE Journal of Solid-State CircuitsIEEE Transactions on Electron DevicesIEEE Transactions on Microwave Theory and TechniquesIEEE Sensors Journal以及国际微电子领域顶级会议IEDM论文等;获国内外发明专利70余项。荣获中国电子学会自然科学一等奖(排名1)。

担任或曾任IEEE电子器件学会副主席(中国大陆首次)、IEDM执委(中国大陆首次)、IEEE电子器件学会教育委员会主席(中国大陆首次)、中国微米纳米技术学会理事、IEEE电子器件学会杰出讲师、IEEE EDTM执委、IEEE JEDS编委、IEEE Transactions on Nanotechnology编委等学术任职。


image.png

通讯作者

田禾,清华大学集成电路学院副教授,集成纳电子所副所长,博士生导师。


近年来主要研究领域包括基于二维材料(石墨烯、二硫化钼、黑磷等)的新型微纳电子器件:晶体管、存储器、传感器/执行器等。在NatureNature Communications, Science AdvancesAdvanced Materials, Nano Letters, ACS Nano, IEEE TEDIEEE EDL等期刊发表SCI论文150余篇,微电子器件领域顶级会议IEDM 11篇,论文总他引超过7000次,h因子48。主持国家自然基金优秀青年基金及面上项目、北京市自然基金项目等,获中国电子学会自然科学一等奖(排名3),教育部霍英东青年教师基金,入选中国科协青年托举工程,以及首届中国电子学会优秀博士论文等。


image.png

通讯作者

杨轶,清华大学集成电路学院副教授,集成电路学院党委副书记,博士生导师。


长期致力于智能微纳器件与系统的研究,在二维纳电子器件、纳米声学器件、集成谐振器件、柔性电子器件及其应用系统等方面取得多项重要创新性成果。承担和参与国家重大科技专项、国家重点研发计划、国家公益性行业科技专项、973课题、863课题、国家自然科学基金重点项目和省部级科研项目等10余项。在Nature CommunicationsACS NanoNano lettersAdvanced MaterialsScientific ReportsNanoscaleIEDM等国际著名学术期刊和会议发表论文150余篇,获授权发明专利10余项。近年来担任电子器件领域国际学术会议IEDMEDTMICSICT技术委员会委员等重要学术任职。


image.png

通讯作者

罗清泉,主任医师,现任上海市肺部肿瘤临床医学中心常务副主任,上海交通大学博士生导师,国务院特殊津贴专家。


罗清泉教授从医三十余载,在胸部疾病外科治疗,尤其是机器人辅助胸外科学技术上有丰富经验。他完成了中国大陆第一例达芬奇机器人胸部手术,目前致力于肺部肿瘤的诊断、外科及多学科治疗,提出了肺癌外科完整性切除的新理念和一系列外科操作技巧。作为主要参与人获得2018年度上海市科技进步二等奖,2019年中华医学科技奖二等奖,2019年度华夏医学科技奖二等奖及2020年度中国抗癌协会科技奖一等奖,2020年获评“上海工匠”、“上海医务工匠”荣誉称号。主持包括国家自然科学基金面上项目在内的多项国家级、省部级课题,担任Fellow of the American College of Surgeons (FACS),Fellow of the Royal College of Surgeons (FRCS),中国医师协会医学机器人医师分会第一届委员会副会长, 中国医师协会医学机器人医师分会胸外科专业委员会创始主委,吴阶平医学基金会模拟医学部胸外科专业委员会副主任委员,中国医师协会胸外科医师分会微创外科专家委员会常委等学术或专业职务。在Nat Mach Intell, J Exp Med, EBioMedicine, Ann Thorac Surg, Cancer Immunol Immunother, J Exp Clin Cancer Res, Comput Biol Med等知名期刊上以第一/通讯/共同通讯作者发表SCI论著40余篇,H因子20

原文传递


详情请点击论文链接:

https://www.nature.com/articles/s42256-023-00616-6‍




https://blog.sciencenet.cn/blog-3406013-1378563.html

上一篇:中国半导体十大研究进展候选推荐(2023-002)——非中心对称二维单晶材料通用制备
下一篇:专刊 | 半导体学报2023年第2期——新型半导体生化传感专刊
收藏 IP: 223.71.16.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 10:53

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部