Riemann7的个人博客分享 http://blog.sciencenet.cn/u/Riemann7

博文

声纹确认和语音分离

已有 4624 次阅读 2019-1-4 11:42 |个人分类:学术会议|系统分类:科研笔记

2018年上半年我们将声纹识别的项目收尾,所做的研究写成论文,分别发表在6月份法国Les Sables d’Olonne召开的Odyssey 2018(说话人和语言识别研讨会)和9月份在印度Hyderabad召开的语音领域权威会议Interspeech 2018(语音通讯联合会年度会议)上。从18年三月份开始我们启动了单麦克风多说话人的语音分离的研发项目,初期的研发成果发表在11月份在意大利博洛尼亚大学召开的FRUCT23(芬兰-俄罗斯大学电信合作开放式创新协会会议)上发表。2019年上半年我们会继续语音分离的研发,希望有更多的成果发表。


    在Odyssey 2018发表的论文题目是“A Double Joint Bayesian Approach for J-Vector Based Text-dependent Speaker Verification”,在该论文中我们提出了DoJoBa模型(双重联合贝叶斯模型),推广了标准的联合贝叶斯方法,以显示和联合地方式对声纹的多面信息进行建模。在公共RSR2015数据语料库中的实验结果表明,我们的DoJoBa模型的错误率低至0.02%。

2018法国.jpg

     在Interspeech2018我们共发表了三篇论文,题目分别为“Double Joint Bayesian Modeling of DNN LocalI-Vector for Text Dependent Speaker Verification with Random Digit Strings ”(关于基于随机数字串的文本相关说话人确认),“Latent Factor Analysis of Deep Bottleneck Features for Speaker Verification with Random Digit Strings”(关于基于随机数字串的文本相关说话人确认),“Joint Learning of J-Vector Extractor and Joint Bayesian Model for Text Dependent Speaker Verification”(关于固定密码的文本相关说话人确认)。

2018印度1.jpg

    在FRUCT23上发表的工作主要是关于语音分离的,题目是“Deep Clustering With Constant Q Transform For Multi-Talker Single Channel Speech Separation”(基于CQT和深度聚类的多声道单声道语音分离)。语音分离的目标是将目标语音与背景干扰分开。 在信号处理中,语音分离是一种非常基本的任务类型,具有广泛的应用,包括听觉增强,移动通信,高精度的自动语音和说话人识别。 

2018意大利.jpg




https://blog.sciencenet.cn/blog-907554-1155263.html

上一篇:基于IoT设备、手机、智能家电的语音密码技术
下一篇:语音声音分离软件FurcaNeXt v1.0
收藏 IP: 67.218.144.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-16 05:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部