《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

【泥沙龙笔记:语义可以绕过句法吗】

已有 3505 次阅读 2016-6-3 08:01 |个人分类:立委科普|系统分类:科普集锦| 语义, 句法, 逻辑语义, 表层结构, 深层结构

雷晓军: 可以直接语意吗?绕过句法。
我: 直接语义绕过句法是绝对错误的
雷: 愿闻其详
我:
这个以前谈过多次,也有历史案例(Wilks),董老师也一再教导,那是死路。但是对于pure research,是个可以探索的方向。
我的 NLP University 跟洪诗人的打油八宝盆似的,只要事关 NLP,里面啥都有 -- 除了深度神经算法。
雷:
@wei 是没有走通,还是死路?
我:
从 scale up 和 real life 而言,没有走通,出不了实验室,因此是死路。更关键的是,句法tractable,更靠谱,多数情况下已经可以支持应用,不用白不用。句法多漂亮清晰 tractable 啊,语义多 dirty 混乱不讲道理不可收拾啊。舍此而求彼,殆也。舍近求远,是本末倒置。
雷:
动词的坑框架不是很清晰吗?
我:
动词的坑框架大多属于句法 subcat 的范畴。即便可以暗度陈仓地走私语义和常识进来,也不改句法制导的总体路线。
雷:
什么是语义?什么是句法?
我:
纯语义的模板是概念层的 “subcat”,基本上就是一个常识系统,HowNet 那一类。
雷:
case theory是句法?
我:
对 费尔默的格语法是句法里面的语义派。
白:
没有明显形式标记的case不算
我:
不是纯语义。
雷:
什么是纯语义?
白:
我关心搭配,尤其是多对多的搭配算不算句法
雷:
对呀,搭配是语义搭配吧?
我:
譬如为了parse “我吃鸡” 或 “鸡我吃”,你不做 xp,也不做 主谓宾,你只用 Animal EAT Food 这样的语义模板,这就叫绕过了句法的纯语义路线。
雷:
主谓宾是什么?要主谓宾有什么用?
我:
主谓宾是句法关系啊。逻辑主谓宾是深度句法关系,反映深层结构,董老师叫做逻辑语义。
纯语义系统有两个组成部分:对应于词汇的概念本体(ontology),对应于句法的语义常识模板。
雷:
语义中有agent,object等不就可以了吗?为什么要主谓宾?我越来越糊涂了
我:
乔姆斯基你是怎么学的啊?乔姆斯基 50 年代不就说了吗,光深层结构不行,因为看不见,需要表层结构作为桥梁走到深层结构,这是 parsing。如果生成(generation),就需要深层结构走到表层结构。这个原理是亘古不变的。
雷司令是装糊涂。
雷:
乔姆斯基不讲语义的,只是偷用语义。
我:
乔姆斯基强调句法与语义分开,并不是说乔姆斯基不讲语义。不讲语义做什么语言呢?语言成为完全的积木。
雷:
乔姆斯基真的不讲语义,他只关心句法,而且认为句法就够了
我:
即便是积木,怎样搭建成一个目标建筑,那也是语义啊。
雷:
句法是innate的
我:
句法不能吃饭,只有落地为语义才能。
白:
如果想得到去伪歧义的句法分析结果,就要明里暗里使用各种盘外招。伟哥在分析器里内嵌了一部分盘外招,留了一部分盘外招给语义中间件。我认为两种盘外招可以统一于大数据。
我:
说的极是。不过,“我认为两种盘外招可以统一于大数据”,这个还需要看看。能不能高效地走通大数据的这条路,我有些怀疑。
雷:
他的学生Jerry Fodor更极端,人脑中就有句法的modularity,语义的加入是NLP的事情,是为了工程,同语言无关
我:
乔姆斯基的确想让句法自制,但是那是句法系统内部的事儿。最后的结果仍然是句法导向语义的接口。
雷:
语言学中语义学不是显学吧?
我:
我觉得你被quasi-Chomsky洗脑了。什么是语义:不外两个落脚点,一个是本体,一个是逻辑语义。
雷:
我在的学校乔姆斯基的学生云集,都是被Jerry Foder弄来的。
本体和逻辑语义都是计算机的人在弄吧
我:
不是,费尔默是语义巨人(《语义三巨人》),逻辑语义就源于他的格语法(Case Grammar)。
至于本体,其实就是词典,概念词典。
雷:
他只是龟缩在西部,东部的人不认
我:

那是因为乔姆斯基光芒太甚,费尔默没法跟乔对抗。但是对 NLP 的影响,其实 费尔默 比 乔老爷可能更大,特别是后期的 NLP 规则派,董老师啊 日本长尾真啊,都是受到费尔默的深刻影响的 NLP 代表人物。当然到了统计学习派,什么乔姆斯基 费尔默 都不尿他们了

董:据已故汉语语法学家林杏光先生的著作称,汉语语言学家提出并对于所谓的“格关系”的研究,要比Fillmore的“Case for Case”早四分之一个世纪。所谓的“格”的领悟是操汉语的人们的天生的智慧。例如:吃饺子、吃馆子中”吃“的意义不变,而宾语的语义不同,这样就有了受事宾语、处所宾语等的分别。

雷:
费尔默的动词坑框架不是被伟哥批评为不接地气吗
我:
费尔默有两段学术生涯。第一段是格语法,董老师发展为逻辑语义。这一个理论和实践是接地气的,关键的。
白:
句法也有坑的
雷: 句法的坑不同于格吗?
白:
句法的坑,你可以想象成某种“正式语序”下的直接成分。而真实语言中,除了正式语序之外,还有若干“变种语序”。
我:
费尔默后期的 FrameNet 虽然是格语法的自然延伸,朝着语义语用的方向进一步深入,但是不接地气,因为没有必要这样来连接语义和语用,直接从格语法进入语用要方便得多。FrameNet 是有道理的东西,但是没有什么实用价值。
白:
建立变种语序与正式语序之间的关联,就是“填坑”, 句法意义上的
雷:
这个要建立在词法上?
我:
白老师说,没有明显形式标记的case不算,,这个实际场景是这样的:
形式标记的 case (就是我说的语言形式,见 《泥沙龙笔记:漫谈语言形式》) 是输入,逻辑语义是输出。这个输入条件可以是显性的语言形式,包括词法的格标记、词序,也可以是隐性的语言形式,包括 POS,包括 ontology,所谓 subcat 就是这样一个编码在词典里面的输入与输出的潜在对应关系。然后句法分析器根据它来实现输入对输出的映射。也就是实现从表层结构的语言形式对深层结构的逻辑语义的求解。deep parsing 说到底就是这么个事儿。

subcat 总是词(老爷)驱动的,里面规定了在哪里(词序)找什么样的(节点条件)放到什么 arg (逻辑语义)去。

洪:

   伟爷天天摆龙门,

   语法语义跨越坑。

   Deep Parser有锋刃,

   庖丁解牛想找新。



【相关】

泥沙龙李白对话录:关于纯语义系统

没有语言结构可以解析语义么?(之二)

NLP University 

 泥沙龙笔记:漫谈语言形式

 《语义三巨人》

【立委科普:本体知识系统的发展历程】


《泥沙龙铿锵三人行:句法语义纠缠论》


【没有语言结构可以解析语义么?浅论 LSA】


【置顶:立委科学网博客NLP博文一览(定期更新版)】  





https://blog.sciencenet.cn/blog-362400-982111.html

上一篇:【新智元笔记:做NLP也要见好就收,适可而止】
下一篇:【泥沙龙笔记:关于语法工程派与统计学习派的总结】
收藏 IP: 192.168.0.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-26 18:00

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部