|||
总结一下要点:
【1】 规则系统模拟人的语言理解,着重结构分析,深度上是关键词(ngram)系统无法达到的
【9】 deep parser 是核武器,很繁难,但是是领域独立的,一旦做了,就可以支持各种应用。这样一来,语义落地模块面对的是逻辑化的句法结构,使得一条逻辑结构的语义规则等价于千百条(毫不夸张)语言表层规则的能量。
【10】 deep parser 的繁难和手工性在工业界不是缺点,而是竞争优势,因为它把竞争对手抛在后面,提高了门槛。而学习方法,不管怎样花样翻新,对手赶上来的机会和速度还是大多了。
譬如 语音识别的突破,首先是在一两个小组,譬如 Nuance 和讯飞等,但很快整个行业全面提升。因为方法是通用的 自动的 迟早会被赶上来。规则系统的设计和实现则不然,因人而异。何况过去20多年,规则一派严重的断层,学问的传承只有极少数幸存的人得道。
这样一来,多语开发虽然仍旧繁难,但比起从头只做一门语言,要省力很多。
【后记】
我:
这一阵子笔记爆炸,backlog 太长,根本就整理不过来。整多少算多少吧,至少不是白开水.几乎赶超洪爷打油了。到退休的时候,怎么也得整个桂冠NLP鼓吹手的称号啥的。
洪:
你的笔记是超越沈括的梦溪笔谈啊
我:
据说毛泽东思想是我党集体智慧的结晶。As long as 这个群和白老师群继续存在,立委NLP笔记也是二群集体智慧的结晶,在下就是主编而已。
Guo:
学朱德熙写"语法问答"吧。
我:
不是已经开办大学了吗?等到桃李满天下了,看那个教授有我的学生多?华人子弟学NLP的,很少有错过我的网上 NLP University 的吧?据说有些教授也在推荐。
【相关】
Comparison of Pros and Cons of Two NLP Approaches
【why hybrid? on machine learning vs. hand-coded rules in NLP】
钩沉:Early arguments for a hybrid model for NLP and IE
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-21 23:47
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社