《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

【李白对话录:谁无知呢?】 精选

已有 5009 次阅读 2016-5-7 01:48 |个人分类:立委科普|系统分类:科研笔记| 语义, 句法

李: 文章无知,还是行为无知,还是行为的施事无知?人的理解从小句行为最后落实到小句里面的主语。貌似涉及某种 reasoning,由行为延伸到施事。

白: 文章无知,是说文章体现了作者的无知

李: 是啊,“转文章无知”也是说的转文章的人无知。这个角色的转移有迹可循。

就是说,如果依存句法上的两个nodes语义不搭,那么可以深入到显性的或隐性的施事去找搭配。这是从 whole 到 part,合理合法,尤其是如果这个 part 是施事的话。

一个小句本来是由谓词代表的,从依存句法上看,所谓谓词中心论。但是从逻辑上看,施事和谓语实际上在小句的地位并非老子儿子的隶属关系,而是可以平起平坐的,这也是相当普遍接受的观点。因此,一旦小句谓语与其dependent不搭,平移到其施事是逻辑的自然。

关于主语谓语平起平坐论,这在结构主义的语法学界是老生常谈了。甚至在动词中心论的框架里,施事主语也处于一个特殊的地位,学名叫 external arg,不能混同于小字辈的宾语补语等 internal args,道理也蛮显然:internal args 是针对谓“词”的,而主语的对手则是谓“语”,不在一个层次,尽管依存树形图为省事,模糊了这种地位之别,在这一点上,反映出来的语义关系,的确不如乔姆斯基的 X bar 假说及其图示(当然 X bar 叠床架屋,似乎"走火入魔"到了另一个极端。见 乔氏 X 杠杠理论 以及各式树形图表达法)。

昨天说过,人的自我中心在语言中表现极为明显,词汇中有约一半与人有关,大千世界加在一起分享另一半的词汇。细一点说,词汇中大约三分之一以上是专门与【人】有关的,不能用于非人,譬如“勤奋”、“支持”,否则就是不搭。另有三分之一的词汇,是【人】与非人都可以关联,譬如“好坏”、“支撑”。剩下的不到三分之一才专属于描述大千世界,不能用于【人】,譬如“凛冽”、“【狗】吠”。没做具体统计,毛姑姑,但应该是不离谱的,因为我整天就在词汇和语法的海洋里翻滚。

这个“无知”就是一个指向【人】的形容词。动作或小句本身不是【人】,但动作的施事常常是【人】,于是“无知”就这样自然而然在我们心目中转移了指向。

我们可以在句法后的语义模块模型这个语义平移,不过是增补一条“有向直接联系”(dag)罢了,易如反掌。但是对于句子中没有显式出现的施事(“文章”的隐式作者),自然语言理解要想模型人的这种平移,就要费一点周折。

白:

“张三炒股票很疯狂,张三炒的股票很疯狂。”

同样语义不搭,寻找修辞性解释和寻找隐式候选解释的机会可能同时出现。

大数据往往支持修辞性解释

李:

寻找隐式候选解释是平移,语义约束不变。寻找修辞性解释更常发生,语义约束层层放宽。直到宽得自己都不确定是不是真地理解了,即便看成是修辞用法。

理解不理解修辞用法,与一个人的背景知识面有关。孤陋寡闻者不可理解的语义不搭,在经历丰富的人看来不是问题。

大数据也不是盲目支持修辞性解释。这种解释一定是呈某种正态分布,这是大数据的本性决定的。正态分布的峰值区间是正解或本解,是搭配圆满的语义,不是修辞性的解释。然后随着语义约束的步步放宽,语义不搭的直感越甚,各种修辞性的解释也随之而来,直到不知所云,跌入分布区间的边缘。

换句话说,语义不搭的程度在大数据上可以反映出来,大数据背后的语言共同体对于从本义延伸至修辞性意义的理解程度也随着社会阶层、知识经验的不同而分布不同,白老师这样的理解力应该是分布区间的尽头,普罗百姓撑不了太久,遇到不搭很可能一脸茫然。在这个时候,如果恰好有由此及彼的可能性,哪怕所及之物是隐含的(譬如明说的是“文章”,隐含的是文章的作者),理解者可能豁然开朗,把语义搭配投射到隐含者身上,不去深想那可能太深奥的修辞用法了。

白:

股票疯狂,说的是股票的整体走势离谱,而不是炒这只股票的人疯狂(实际上,单个个体散户的偶发疯狂根本奈何不了一个体量很大的股票。)在粗通股票的人群中,都知道股票疯狂的这个意思,这一点也可以从大数据中股票与疯狂的搭配统计中得到印证。并不需要高深的理解力。任何修辞用法,都有直接的或推断的流通度作为支撑基础,否则直接短命死掉。直接的流通度,就是AB虽不搭配,但AB在大数据中具有统计意义显著的共现。推断的流通度,就是AB既不搭配,在大数据中的共现频度在统计上也并不显著,但是,对于在某种向量投射下(比如word2vec)与A距离较近的C和与B距离较近的D,CD的共现频度在统计上显著,那么AB会被“推断”为与CD具有相当可比性的修辞现象。

李: 这种情形不能算是严格意义的“修辞”。可能是历时的词源意义的修辞,不是现时的修辞。大数据支持的是本义,不是修辞,不是引申。否则就没有什么优选语义的概念了。优选的隐含意义就是数据量。

白:
非词典义,非subcat规则义,剩下就是叫法问题。没有大数据时,优选语义就是画饼。

李:我们不管怎么有人人平等的道德情怀,也不得不承认人与人的理解力之差别往往超过我们当初的想象。这就好比,人与人的工作能力和创造能力的不同一样。做过招聘经理的人都体会过人与人的差别之大。据说斯大林相信林彪一人值三个师,虽然是传言,但人与人的差别,与贫富悬殊的鸿沟几乎可以一比。

意识流,扯远了,打住。

回到正题:谁无知呢?首先是普罗,然后是精英中的专才,最后是精英中的通才。最不无知的是立委的老友镜子(mirror),有 镜子大全 为证。

声明一句(不是为了政治正确):以上闲扯绝对不是维护贫富悬殊的社会不公。只是指出了一点现代社会文明以后,为什么反人类反道德的贫富悬殊反而越来越大的成因之一。

凡事有多种角度,不能单从人的能力或贡献的角度看贫富差距,因为从那个角度,存在的都是合理的,无需改变。作为社会主义的信仰者,可以提供另一个角度。

地球是有限的,资源是有限的,这是一。人人平等是天定的,无需论证,这是二。在有限的资源上居住着人人平等的人类,这就必然得出下列结论:贫富鸿沟越来越大是罪恶的,必须通过税收(或革命)阻止这种趋向。

因为一切的聪明才智和创造力都是在耗费资源的基础上才得以施展或实现。而这个资源是公共的、全民的。因此不仅你我的成果必须共享,而且你我个人的收入都不能无限离谱。

一个“完全无用”的人,无论是残疾也好,还是健康但无能也好,只要他生存在这个世界,就必须保障他的社会福利,必须让他共享社会繁荣的成果。这里没有任何施舍。这是他生在这个世界作为一个平等人类一份子所应得的资源被社会或他人利用以后的合理报偿。

因此,我支持桑德斯。不过为了打败川普,我投票克林顿。只有社会主义庶几可救美国。只有真正的社会主义才能救中国,抑制住中国贫富大分裂的势头。如果共同富裕不现实,至少不能让贫富差距越来越大。不是说要消除贫富差别,是要设置一个比例,不能任这种趋势非理性非道德地无限鸿沟下去。社会主义设置了最低工资,这是一大进步。等到社会开始立法设置最高工资的时候,这个进步才完整。西方的做法是不设置限制,然后利用税收政策倾斜,诱使富翁成为“慈善家”。搞得每个富翁都像个菩萨一样被人尊崇,慈善的多少也没有制度的保障。第一,他们根本就不是慈善家,这些善款本来就应该是社会的。第二慈善的指向和规模带有太大的任意性,这实质是对社会财富的不负责任。






【相关】

乔氏 X 杠杠理论 以及各式树形图表达法


【科普小品:文法里的父子原则】

【新智元笔记:中文自动分析杂谈】

【置顶:立委科学网博客NLP博文一览(定期更新版)】  




https://blog.sciencenet.cn/blog-362400-975492.html

上一篇:【新智元笔记:中文自动分析杂谈】
下一篇:秘书之紧要,姑妄信之
收藏 IP: 192.168.0.*| 热度|

2 武夷山 shenlu

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-22 09:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部