||
上一周我们的研究成果“基于j-vector和joint PLDA的短时长文本相关说话人确认(声纹确认)”在冲绳举办的ASRU2017(The 2017 IEEEAutomatic Speech Recognition and Understanding Workshop)上发表,该技术可以用于IoT设备、手机、智能家电等场景中的语音密码。
图1 本次会议得到谷歌、微软和腾讯等公司的赞助
声纹确认就是用待识别语音和预先提取的说话人特征来鉴别出说话人身份的一种技术,是语音信号处理领域一个十分活跃的研究方向。从本质上讲,声纹识别是语音信号模式识别的问题。传统的声纹确认需要较长语音(~15秒或以上)才能取得不错的性能,然而在目前的很多应用中,如语音解锁等,用户是没有耐心说15秒用于解锁的。因此亟需研发基于短时长语音(~3秒或以下)的声纹确认技术。为了解决该问题,我们开发了一种基于j-vector和joint PLDA的短时长文本相关说话人确认技术,该技术同时考虑说话人的身份信息和说话内容信息。
我们的技术成功的将认证语音的长度降低到了3秒左右。在对不同语言(中文和英语)的大规模数据语料进行的实验显示,在impostorwrong和targetcorrect的两种情况下,错误率均在1%以下。特别的,在新加坡I2R研究所公开的RSR2015数据语料库上,结果显示我们的方法在impostorwrong和targetcorrect上可以分别达到0.02%和0.09%的错误率。
图2 我们研究成果的海报
图3 冲绳的海
感兴趣的朋友可以联系我们。
邮件:shiziqiang@cn.fujitsu.com
电话:13621160486
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-5-16 16:12
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社