Riemann7的个人博客分享 http://blog.sciencenet.cn/u/Riemann7

博文

活动语音检测软件,LillyVAD V1.0

已有 5310 次阅读 2014-7-23 11:22 |个人分类:科研DEMO|系统分类:科研笔记| 检测, 下载链接, 活动语音检测, 语音断点检测

我们设计并实现了一种用于实时检测活动语音的软件。首先给出软件的下载链接:

DEMO.zip

活动语音检测 (Voice activity detectionVAD), 也称为 speech activity detection or speechdetection 或者语音端点检测, 是一项用于语音处理的技术,目的是检测语音信号是否存在。VAD技术主要用于语音编码语音识别。它可以简化语音处理,也可用于在音频会话期间去除非语音片段:可以在IP电话应用中避免对静音数据包的编码和传输,节省计算时间和带宽

VAD技术有非常广泛的应用,例如:

·        VAD是许多语音通信系统的不可或缺的部分,如音频会议、回声消除语音识别语音编码和免提电话;

·        在多媒体应用领域,VAD允许系统同时进行音频和数据应用;

·        通用移动通讯系统UMTS)中,它可以控制降低平均比特率,并提高整体的语音编码质量;

·        在蜂窝式无线电系统(GSMCDMA)的基础上的不联系传输(DTX)模式,VAD可以通过降低同信道干扰和功率消耗来提高偏斜式数字设备的系统容量。

 

我们设计并实现了一种用于实时检测活动语音的软件。这种软件建立在每帧每个频率点的语音存在概率的基础上。根据概率大小判断是否存在语音。本软件在高噪声情况下的准确率能够达到95%以上。 我们的方法和语种无关,在demo里面给了中文,英语和法语的实验样例,都能够很好的检出。   

软件的使用方法如下:

1,软件界面如下:

 

2, 点击OPEN,打开波形文件(.wav):



3,点击PLAY,播放音乐文件:


4,点击RECOGNIZE,检测活动语音:


5, 有语音活动信息的波形文件(.wav):


感谢关注!



Voice activity detection (VAD), alsoknown as speech activity detection or speech detection, is a technique used inspeech processing in which the presence or absence of human speech is detected.The main uses of VAD are in speech coding and speech recognition. It canfacilitate speech processing, and can also be used to deactivate some processesduring non-speech section of an audio session: it can avoid unnecessarycoding/transmission of silence packets in Voice over Internet Protocolapplications, saving on computation and on network bandwidth.

VAD is an important enablingtechnology for a variety of speech-based applications. Therefore various VADalgorithms have been developed that provide varying features and compromisesbetween latency, sensitivity, accuracy and computational cost. Some VADalgorithms also provide further analysis, for example whether the speech isvoiced, unvoiced or sustained. Voice activity detection is usually languageindependent.

It was first investigated for use ontime-assignment speech interpolation (TASI) systems.





https://blog.sciencenet.cn/blog-907554-813934.html

上一篇:图像分类识别系统(object recognition system)(更新中。。。)
下一篇:语音基频提取软件、音乐旋律提取软件,LillyMELODY V1.0
收藏 IP: 59.151.112.*| 热度|

1 Vetaren11

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-16 16:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部