昨夜和几个同事翻译视频,难度比我想象的大很多。因为是自己录直播视频,然后马上开始翻译,故而没有英文字幕。可以想象,难度马上从翻译变为了听写。原则上听写不是不可完成的任务,但是缺乏准备,所以手头没有好用的工具,就拿着鼠标来回拖动视频。花了半个小时只听写了两分钟的视频。最后没有完成预定工作量,只能做了缩减。
早上起来,搜索了一下有没有什么用于听写的工具,搜到一个,看着不错。地址在
http://otranscribe.com/
这是一个基于网页的工具(基于HTML5,据说因此文件不用上传),有些方便的快捷键,可以倒回几秒、快放、慢放、加时间戳。昨夜要是有这个工具,应该能多听写一些。
后来忽然想到,有没有什么软件能把声音转换为文字?这就是语音识别问题,这样的软件应该是有的。搜了一下,感觉靠谱的只有两种,一种就是Window XP自带的语音识别,另外一种就是IBM开发的语音识别系统。按照说明,后者每分钟可以输入150个汉字。准备尝试一下。
https://blog.sciencenet.cn/blog-117333-955738.html
上一篇:
思考题(三十八)通信为什么用窄带信号?下一篇:
会议文集《Frontiers in Radio Astronomy 2015》勘误表