||
用于语音增强的低秩最小方差无失真响应波束成形滤波器的神经优化
白宇恒1,裴汉晨1,张耀恺1,崔昭悦1,黄公平1,陈景东2,Jacob Benesty3
(1. 武汉大学 电子信息学院, 武汉 430072;2. 西北工业大学 航海学院 智能声学与临境通信研究中心,西安 710072;3. 魁北克大学 国立科学研究院 能源、材料与电信研究中心(INRS-EMT), 加拿大 蒙特利尔H5A 1K6)
摘要: 具有大量麦克风的麦克风阵列观测通常呈现低秩特性。有效识别并利用这种低秩结构对于先进的麦克风阵列处理至关重要,这也推动了低秩波束成形技术的发展。此类波束成形器基于克罗内克积分解,传统上通过迭代算法估计两组子滤波器。本文提出了一种神经低秩波束成形器,它采用两个神经网络直接估计这两组子滤波器。每组子滤波器由一个基于 Conformer 的网络进行预测,该网络结合了 Transformer 和卷积神经网络的优势,以捕捉长程依赖关系和局部特征。与先前仅限于标准矩形阵列拓扑和一阶设计的神经克罗内克波束成形器不同,本方法支持任意阵列拓扑和更高阶的低秩波束成形器。实验结果表明:所提出的低秩神经最小方差无失真响应波束成形器持续优于传统的和基于克罗内克分解的最小方差无失真响应波束成形器。
关键词: 麦克风阵列,语音增强,低秩波束成形,克罗内克积分解,神经波束成形,最小方差无失真响应
扫二维码浏览全文

Cite this article
Bai, Y., Pei, H., Zhang, Y. et al. Neural Optimization of Low-Rank MVDR Beamforming Filters for Speech Enhancement. J. Shanghai Jiaotong Univ. (Sci.) (2026). https://doi.org/10.1007/s12204-026-2901-5

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-2-4 11:11
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社