||
智能语音在病理医疗方向的研究进展与趋势
高迎明1, 伍杨晴2, 杨飞3,周莹莹1,李雅1,吴梦玥3
(1. 北京邮电大学 人工智能学院,北京 100876;2. 上海交通大学 巴黎卓越工程师学院,上海 200240;3. 上海交通大学 计算机学院 人工智能教育部重点实验室 X-LANCE实验室,上海 200240)

摘要:智能语音技术植根于传统医学“闻诊、问诊”诊疗方式,如今已发展成为现代病理医疗领域的变革性技术。该技术通过解析语音、人声、咳嗽声、呼吸音、心音等声学生物特征,可对精神类疾病、神经退行性疾病、呼吸系统疾病、心血管疾病以及咽喉声道病变等多种病症开展无创、低成本的早期筛查、辅助诊断、病情监测与康复评估。本文系统性梳理了这一交叉学科领域的研究现状与主流发展趋势。首先阐释了病理声学的生理机理,涵盖神经调节异常、气道与肺部病变、血流动力学紊乱、咽喉声道功能障碍等,并介绍了其与人工智能诊断技术的融合应用。文章核心围绕两大研究方向展开综述:一是数据资源建设,包括各类疾病数据集构建与行业标准化工作;二是算法方法创新,梳理了技术演进脉络,从传统基于特征的机器学习,逐步发展至深度学习、自监督模型以及多模态大语言模型。此外,本文还探讨了面向心理健康的智能语音干预系统的发展现状。经分析,该领域呈现出五大发展趋势:由单模态分析迈向多模态融合分析、从有监督学习转向弱监督与自监督学习、应用场景从实验室受控环境走向真实自然场景、模型可解释性愈发受到重视、研究方向向多病共存建模延伸。尽管该技术具备良好的临床应用前景,但目前仍面临数据稀缺、算法鲁棒性不足、临床落地衔接不畅等诸多难题。针对现存问题,本文提出未来重点研究方向:推进联邦学习与多中心联合验证,结合医学知识打造可解释人工智能,通过软硬件协同设计提升模型跨设备、跨环境适配能力,完善人机协同诊断模式,同时建立健全行业标准与监管体系。唯有依托多学科协同攻关突破现有瓶颈,才能构建全流程智能医疗服务体系,助力精准医疗落地,推动医疗服务普惠化发展。
关键词:病理声学,智能语音分析,声学生物特征,心肺音,多模态学习,临床决策支持
扫二维码浏览全文

Cite this article
Gao, Y., Wu, Y., Yang, F. et al. Research Progress and Trends of Intelligent Speech in Pathological Healthcare. J. Shanghai Jiaotong Univ. (Sci.) (2026). https://doi.org/10.1007/s12204-026-2943-8
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-6-27 14:28
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社