liuhaidongooo的个人博客分享 http://blog.sciencenet.cn/u/liuhaidongooo

博文

对语音智能的继续研究

已有 1153 次阅读 2022-4-18 17:26 |个人分类:我的原创论文|系统分类:论文交流

要机內处理语音,参考处理文本的发展道路,仍然要走编码的道路,这个时候,我们的汉语大有用武之地,可以对每个汉字发音的标准模式编码,可以对每个汉语词汇发音的标准模式编码,现成的汉语大字典和汉语大词典,现成的国标汉字库,都可以借鉴,对于外语语音、民族语音、地方方言语音翻译成机器普通话可以分别建立字词对照库,像英汉辞典,像在线翻译,对于个人特点语音翻译成机器普通话,可以通过机器学知建立字词对照库,字和词连成句、段语音可以借鉴数据结构的连接理论,这样,语音的机內普通话存储就不成问题了,至于理解语音的意思,这是核心技术,需要攻关,比如建立语音意思语句库,都是各种语音句子模式对应的软硬件操作,语句库装语句标准比对模式,做模式比对,对应的语句关联有关软硬件操作,这个对应语句不能只有一个,而应该是一个集合,集合里装载所有对应一个软硬件操作的可能存在的语音句子标准模式,这里可以借鉴汉语语法组织语句库和比对工作,句子出来了再做段落逻辑判断,建立逻辑判断的各种规则,实际第一句即为第一个操作模块,再比对第二句即为第二个操作模块,以此类推,语句库要海量标准模式,但以现有技术这不难,因为我们建立那么多的数据库字库的经验都可以借鉴,对于机內处理语音,过去处理文本的研究成果都可以借鉴,因为处理文本也用到了很多模式,这里还提一个下围棋的例子,围棋模式库好比语音语句库,对手下第一个子,机器可以将围棋模式库的模式分成有用模式和无用模式两个集合,在有用模式找最佳落点,对手下第二个子,机器再将第一个有用集合分成有用集合和没用集合,再在有用集合找第二个最佳落点,以此类推,我们翻译语音句子一样可以这样,根据第一个字词语音在语句库划分有用模式集合和无用模式集合,根据第二个字词语音在语句库第一个有用模式集合再划分第二个有用模式集合和无用模式集合,以此类推,如果存在多种意思则询问说话人,对方回答后再第二次句子比对,以此类推,最后意思就出来了,还有一个问题,对于一个语音句子要有去掉多余字词的功能,比如一个句子第一个字词造成语句库有用模式集合是空集,这个字词就可以去掉,继续比对第二个字词,比对过程中任何时候新增字词造成有用模式集合空集,这个新增字词都可以去掉,这是我想到的一种策略,其他策略大家都可以自己发明,语音语句库的建立和语音句子的模式比对及最终翻译成操作是核心科技,我的研究只能是抛砖引玉,这个核心科技不攻关是不行的,但以我对现有科技条件的了解,这个攻关难度不是很大。至于机器可以与人畅所欲言,机器懂得人所有话的意思,现有技术还实现不了,要看以后的发展了。

https://blog.sciencenet.cn/blog-3482188-1334504.html

上一篇:对语音智能理论还有话要说
下一篇:再论语音智能机內语句库
收藏 IP: 119.130.203.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-20 16:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部