Riemann7的个人博客分享 http://blog.sciencenet.cn/u/Riemann7

博文

基于IoT设备、手机、智能家电的语音密码技术

已有 2642 次阅读 2017-12-26 15:29 |个人分类:学术会议|系统分类:论文交流

上一周我们的研究成果“基于j-vectorjoint PLDA的短时长文本相关说话人确认(声纹确认)”在冲绳举办的ASRU2017The 2017 IEEEAutomatic Speech Recognition and Understanding Workshop)上发表,该技术可以用于IoT设备、手机、智能家电等场景中的语音密码。


图1 本次会议得到谷歌、微软和腾讯等公司的赞助

声纹确认就是用待识别语音和预先提取的说话人特征来鉴别出说话人身份的一种技术,是语音信号处理领域一个十分活跃的研究方向。从本质上讲,声纹识别是语音信号模式识别的问题。传统的声纹确认需要较长语音(~15秒或以上)才能取得不错的性能,然而在目前的很多应用中,如语音解锁等,用户是没有耐心说15秒用于解锁的。因此亟需研发基于短时长语音(~3秒或以下)的声纹确认技术。为了解决该问题,我们开发了一种基于j-vectorjoint PLDA的短时长文本相关说话人确认技术,该技术同时考虑说话人的身份信息和说话内容信息。

我们的技术成功的将认证语音的长度降低到了3秒左右。在对不同语言(中文和英语)的大规模数据语料进行的实验显示,在impostorwrongtargetcorrect的两种情况下,错误率均在1%以下。特别的,在新加坡I2R研究所公开的RSR2015数据语料库上,结果显示我们的方法在impostorwrongtargetcorrect上可以分别达到0.02%和0.09%的错误率。

图2 我们研究成果的海报



图3 冲绳的海

感兴趣的朋友可以联系我们。

邮件:shiziqiang@cn.fujitsu.com

电话:13621160486



https://blog.sciencenet.cn/blog-907554-1091561.html

上一篇:基于深度学习的短时长声纹认证技术
下一篇:声纹确认和语音分离
收藏 IP: 183.91.158.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-16 16:12

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部