|||
拜读了李维老师的几篇博文,连在下面方便以后复习:
【立委科普:自然语言理解当然是文法为主,常识为辅】http://blog.sciencenet.cn/blog-362400-734340.html
科研笔记:自然语言处理领域中的语义路线及其代表人物 http://blog.sciencenet.cn/blog-362400-818487.html
同意泛泛的语义研究不可行。但是真的能离开常识吗?我更愿意把常识(common sense)叫共同的模型(common model)。
语言是交流的工具,但是交流的信息encode在文字里的只是一部分。说话人之间共享一个模型,那末语言只需要编码不同的地方(variance)。所以中文说“没有共同语言”是很痛苦的一件事,但并非指两个人一个讲中文一个讲英语。
那么反映在NLP实践中的一个问题即为:语法处理以后信息的载体是什么?是一堆数据结构吗?没有办法的话只好再转植于另一种自然语言,是为机器翻译。如果机器本身要处理的话,或简或繁模型总是要有的。如果和说话人的不一致,那就是bug了!
码字的本领太低,只好写得简要些,希望不冒犯。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-1 07:09
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社