雷晓军: 可以直接语意吗?绕过句法。
我: 直接语义绕过句法是绝对错误的
雷: 愿闻其详
我:
这个以前谈过多次,也有历史案例(Wilks),董老师也一再教导,那是死路。但是对于pure research,是个可以探索的方向。
雷:
@wei 是没有走通,还是死路?
我:
从 scale up 和 real life 而言,没有走通,出不了实验室,因此是死路。更关键的是,句法tractable,更靠谱,多数情况下已经可以支持应用,不用白不用。句法多漂亮清晰 tractable 啊,语义多 dirty 混乱不讲道理不可收拾啊。舍此而求彼,殆也。舍近求远,是本末倒置。
雷:
动词的坑框架不是很清晰吗?
我:
动词的坑框架大多属于句法 subcat 的范畴。即便可以暗度陈仓地走私语义和常识进来,也不改句法制导的总体路线。
雷:
什么是语义?什么是句法?
我:
纯语义的模板是概念层的 “subcat”,基本上就是一个常识系统,HowNet 那一类。
雷:
case theory是句法?
我:
对 费尔默的格语法是句法里面的语义派。
白:
没有明显形式标记的case不算
我:
不是纯语义。
雷:
什么是纯语义?
白:
我关心搭配,尤其是多对多的搭配算不算句法
雷:
对呀,搭配是语义搭配吧?
我:
譬如为了parse “我吃鸡” 或 “鸡我吃”,你不做 xp,也不做 主谓宾,你只用 Animal EAT Food 这样的语义模板,这就叫绕过了句法的纯语义路线。
雷:
主谓宾是什么?要主谓宾有什么用?
我:
主谓宾是句法关系啊。逻辑主谓宾是深度句法关系,反映深层结构,董老师叫做逻辑语义。
纯语义系统有两个组成部分:对应于词汇的概念本体(ontology),对应于句法的语义常识模板。
雷:
语义中有agent,object等不就可以了吗?为什么要主谓宾?我越来越糊涂了
我:
乔姆斯基你是怎么学的啊?乔姆斯基 50 年代不就说了吗,光深层结构不行,因为看不见,需要表层结构作为桥梁走到深层结构,这是 parsing。如果生成(generation),就需要深层结构走到表层结构。这个原理是亘古不变的。
雷:
乔姆斯基不讲语义的,只是偷用语义。
我:
乔姆斯基强调句法与语义分开,并不是说乔姆斯基不讲语义。不讲语义做什么语言呢?语言成为完全的积木。
雷:
乔姆斯基真的不讲语义,他只关心句法,而且认为句法就够了
我:
即便是积木,怎样搭建成一个目标建筑,那也是语义啊。
雷:
句法是innate的
我:
句法不能吃饭,只有落地为语义才能。
白:
如果想得到去伪歧义的句法分析结果,就要明里暗里使用各种盘外招。伟哥在分析器里内嵌了一部分盘外招,留了一部分盘外招给语义中间件。我认为两种盘外招可以统一于大数据。
我:
说的极是。不过,“我认为两种盘外招可以统一于大数据”,这个还需要看看。能不能高效地走通大数据的这条路,我有些怀疑。
雷:
他的学生Jerry Fodor更极端,人脑中就有句法的modularity,语义的加入是NLP的事情,是为了工程,同语言无关
我:
乔姆斯基的确想让句法自制,但是那是句法系统内部的事儿。最后的结果仍然是句法导向语义的接口。
雷:
语言学中语义学不是显学吧?
我:
我觉得你被quasi-Chomsky洗脑了。什么是语义:不外两个落脚点,一个是本体,一个是逻辑语义。
雷:
我在的学校乔姆斯基的学生云集,都是被Jerry Foder弄来的。
本体和逻辑语义都是计算机的人在弄吧
我:
不是,费尔默是语义巨人(
《语义三巨人》),逻辑语义就源于他的格语法(Case Grammar)。
至于本体,其实就是词典,概念词典。
雷:
他只是龟缩在西部,东部的人不认
我:
那是因为乔姆斯基光芒太甚,费尔默没法跟乔对抗。但是对 NLP 的影响,其实 费尔默 比 乔老爷可能更大,特别是后期的 NLP 规则派,董老师啊 日本长尾真啊,都是受到费尔默的深刻影响的 NLP 代表人物。当然到了统计学习派,什么乔姆斯基 费尔默 都不尿他们了
董:据已故汉语语法学家林杏光先生的著作称,汉语语言学家提出并对于所谓的“格关系”的研究,要比Fillmore的“Case for Case”早四分之一个世纪。所谓的“格”的领悟是操汉语的人们的天生的智慧。例如:吃饺子、吃馆子中”吃“的意义不变,而宾语的语义不同,这样就有了受事宾语、处所宾语等的分别。
雷:
费尔默的动词坑框架不是被伟哥批评为不接地气吗
我:
费尔默有两段学术生涯。第一段是格语法,董老师发展为逻辑语义。这一个理论和实践是接地气的,关键的。
白:
句法也有坑的
雷: 句法的坑不同于格吗?
白:
句法的坑,你可以想象成某种“正式语序”下的直接成分。而真实语言中,除了正式语序之外,还有若干“变种语序”。
我:
费尔默后期的 FrameNet 虽然是格语法的自然延伸,朝着语义语用的方向进一步深入,但是不接地气,因为没有必要这样来连接语义和语用,直接从格语法进入语用要方便得多。FrameNet 是有道理的东西,但是没有什么实用价值。
白:
建立变种语序与正式语序之间的关联,就是“填坑”, 句法意义上的
雷:
这个要建立在词法上?
https://blog.sciencenet.cn/blog-362400-982111.html
上一篇:
【新智元笔记:做NLP也要见好就收,适可而止】下一篇:
【泥沙龙笔记:关于语法工程派与统计学习派的总结】