xuyingxiao的个人博客分享 http://blog.sciencenet.cn/u/xuyingxiao

博文

简单的原理,惊奇的效果:几款语音软件

已有 3983 次阅读 2012-3-30 21:10 |个人分类:思考|系统分类:科研笔记| 软件, 效果, 语音

 
对语音识别领域不是很熟悉,总感觉有很多问题它是解决不了的。但是用过几款很有意思的软件,原理不复杂,做出来的效果却很好。说明不用等技术发展到完美,利用不完美的技术在特定场合完全可以扬长避短做出令人惊奇的应用出来。 
 
  
 
一开始接触的是语音输入。以前学过一些人工智能、神经网络算法,对语音输入并不感到非常惊讶,但觉得其准确率不高,要想真正实用还是很难的。但隔了很多年后发现手机中的语音控制做得还是很酷的。由于手机中就那么几个指令,准确率就很容易提升到实用的水平。 
 
  
 
后来用过吉他的调音软件AP Guitar Tuner。拿着吉他对着电脑的话筒将弦一个个拨过去,电脑中的软件可以识别声音的频率,判断应该把弦调得松一些还是紧一些。识别频率应该比识别语音容易多了,但是用在这个软件上很实用。 
 
  
 
Ipad上Talking Tom的变声,刚接触时感到很震撼。它的原理太简单了,但做出来的效果却让儿童如痴如醉。 
 
  
 
再后来玩过卡拉OK软件K歌达人。对着电脑的话筒唱歌时会显示所唱的每个音的音高和音长,并且会与歌曲每个音符标准的音高和音长进行匹配,这样可以很形象地调整演唱,并可以由电脑对每句及整首歌的演唱进行打分。这个软件比识别吉他的音难一些,虽然没有研究过其算法,但想来算法本身比语音识别要简单多了,用在卡拉OK上倒是别出心裁。 
 
  
 
女儿记得国外幼儿园里一首歌的弦律,但记不清楚歌名了,用歌词也搜索不到原歌曲。好几年前看过哼一首歌就能知道是什么歌的报导,心里感觉这个要做到实用太难了。如今看了这个卡拉OK软件,突然发现技术上实现哼歌搜曲其实是再容易不过了,既然每个音的音高和音长都能识别出来,那么做个模式匹配就能把哼唱的弦律和已有歌曲的模式匹配起来。这样的搜索引擎确实让人眼睛一亮:搜索的不是关键词,而是哼唱的音频。网上最知名的是midomi网站,试了几首中文英文的流行歌曲,大部分都能很准确地搜索刚出来。也有一些意外发现,比如女儿的那首歌竟然是和我们以前学的“哦,苏珊娜“是一样的旋律。此外也发现以前熟悉的”小星星“(一闪一闪亮晶晶)和”字母歌“(ABCDEFG)是一个曲调。另外可以搜索出同一首歌不同国家的版本,比如日语歌きらきら星(フランス民謡,法国民歌) 
 
  
 
  
 
  
 
  
 
 


https://blog.sciencenet.cn/blog-504160-553626.html

上一篇:石头与生命
下一篇:暖春
收藏 IP: 58.25.153.*| 热度|

4 刘洋 刘玉仙 陈学雷 李学宽

发表评论 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-22 05:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部