博文

再聊语义学

已有 4211 次阅读 2016-3-5 14:43 |个人分类:语义论|系统分类:科普集锦| 模态逻辑, 一阶逻辑, 内涵逻辑, 广义量词

新春佳节，多了些码字时间，对语义学就再多聊几句。这次聊有几个重点：
把握语义的几个思路
对世界的认识
概念世界
世界、概念和语言
语义学方法和工具

在上篇《语义学漫谈》中我们主要聊了什么是“语义”的问题。通过这次聊天我们至少知道了一点：语义的研究在很多方面跟语言学的其它方面很不一样。像音素、词素、单词这些东西我们至少直觉上能感觉到是客观存在的：你说了一段话，我可以把这段话录音，你写了一段文字，白纸黑字放在那，想赖也赖不掉，人们常说覆水难收，君子一言驷马难追，就是这个道理。但“意思”就不一样了，人们可以“解读”，如果是牵涉经济利益的法律文书、如财产转让、遗产声明等如果文字上不是滴水不漏难免会被人钻空子。律师是干什么的，就是在各种话语、文件等中找出对自己客户最有利的解读。所以，所谓语义这个概念，实在是一个难以把握的东西，就像空气和水，时时处处感觉到它的存在，但很难轻易抓得住。

上篇“漫谈”我们还谈到了由于语义的概念很难确定，人们现在能想到方法，无非就是词典定义或者借用逻辑学的semantics研究。现在把“漫谈”中提出的问题拿出来再问一遍，单语词典的定义和外汉词典的对译是语义吗？比如，我们用现代汉语词典查一个生词，得到了对这个词的“解释”，能算是懂得这个词的“语义”了吗？反过来，有些人很少查汉语词典但并没有妨碍他们对汉语词汇的准确理解，尤其现在网络用语泛滥，大多根本没有词典可查，对这些新词汇我们大部分人是无师自通（只要你有时间就在网上泡着）。所以至少从我们的直接经验来看，词典的解释就是语义很难说服人。应当说，无论是词典还是百科全书在解释一个词条的时候都已经假定你对该语言有了相当的知识，利用你已知的知识构造新的“知识”。例如朗曼词典的例子，编者使尽了吃奶的力气把定义词汇限制在2000左右，这还是利用了你有限的英语知识。如果你的英语水平没达到这个要求，查一个生词的解释又出现另外的生词那么这个英英词典对你意义就不大了。外汉词典也一样，只是所利用的是你对母语的知识。如果你的母语知识不够用那也没有意义。举个例子，如：monoid=独异点，这个“独异点”可能对你也没意义除非你是学数学或计算机的。这说明英中语言的这两个词对你都没有意义：无论你见到monoid，还是“独异点”其实什么“语义”也没有得到。

从这个意义上，词典的定义很难说就是“语义”：你就算把《现代汉语词典》所有词汇的定义都背得滚瓜烂熟也不能保证可以透彻理解和熟练运用，反过来没有背过词典的人（应当是大部分）也完全可以妙语生珠、舌灿莲花。

那词典中的解释算什么呢？正规的说法应当是“定义”(definition)。定义只能保证对被定义对象内涵意义的严谨，也就是说，定义只告诉你被定义对象是什么（属于什么类型），具有哪些特征和性质，这些特征性质足以把该被定义对象与其它对象分开。有些说明性定义，为了加深读者的理解，除了内涵定义，还加上了外延：举例说明。这个时候，如果读者真正理解了，那就可以在自己头脑中建立独立的“语义”，这使得这位读者下次在遇到这个词汇的时候给出自己的定义和“语义”解释；而且即使这个词出现变异、以不同的形式出现也不会影响该读者对这个词的语义理解。但这些说明、解说文字已经很难说是这个词的“语义”了。

所以，到这里我们基本上可以排除词典定义就是语义的思路。

那逻辑呢？你上回不是说semantics是逻辑学的语义学吗？是的，逻辑学的semantics从人类语言对语义/意义/意思的理解确实不太容易接受。首先，逻辑学的词汇语义范围非常狭窄：只限于有数几个虚词、连词的语义研究：如：和/与、或、如果…则、如若…不然、除非…否则，所有、一些、无、不。而对实词的语义并不关心。

第二，逻辑学对单句的语义，除了包含“所有”、“一些”的句子之外，也不关心。例如：
（1）陈医生一天看10个病人。
（2）陈医生一天就看了10个病人。
（3）陈医生10个病人看了一天。

这三个句子意思一样吗？逻辑学中所谓的语义只是“真值”，句子是否为“真”。这个所谓“真”在现实世界中太复杂了。许多无法确定：
（4）你知道我的手机放哪了吗？
（5）不知道（其实我知道）
那（5）是“真”吗？你明明知道却说“不知道”，当然就是“假”啦。可是我的意思（语义学？）是不想告诉你，我“真”不想告诉你，怎么能说是“假”呢。所以，逻辑学中的所谓“真值”并不是研究重点，真正的重点是真值与真值之间在加上了上面列举的连词后的关系。例如上面（1）-（3），用逻辑的术语说就是：它们的逻辑“真值”相等吗？
而且我们也说了，搞逻辑学的大多数对自然语言敬而远之。因此指望逻辑学的semantics搞自然语言的语义，犹如杯水车薪。
那怎么办呢？当然，前面谈到的，以基本单词为“义素”对单词进行分类，研究多义词、反义词、同义词、同类词以及词与词之间的关系、例如“语义场”等也是很有意义的。它的实用成果就是所谓的'thesaurus'，也就是“同义词-反义词-关联词”词典，在语言教育、语言写作等方面确实非常有用。但基本思想仍然是“定义”：用同义词、反义词、同类词“定义”被定义词的意义。“定义”在自然语言中的运用就是“比”，亦即中国传统的“赋、比、兴”方法中的“比”，直接用语言说不清或者说“不生动”的意思可借用他物：比者，以彼物喻此物也。例如：我对你的爱，像大海一样深沉。而作为语义学成果的thesaurus用的也是这个方法：red是什么意思？scarlet,vermilion,crimson,ruby,cherry,cerise,wine,blood,rose。你看，为了让你理解“红”是什么意思，什么红宝石、樱桃、红酒、血、玫瑰都出来了。意思是，你不知道什么是“红”，难道还不知道血的颜色吗？难道还不知道玫瑰的颜色吗？难道还不知道红酒的颜色吗？难道还不知道樱桃的颜色吗？难道还不知道红宝石的颜色吗？只要你知道其中之一，就明白了“红”是什么意思了。因此，这些单词应当属于同一个“语义场”。
但这类研究充其量也就是将现存特定语言的单词分一分类，使人使用单词更准确、更有条理，并没有回答语义究竟是什么的问题。
这样看来，研究语义只在语言本身打转转好像是山穷水尽了。就好像正数范围内做减法，做着做着做不下去了因为2-5=？没法做。我们必须扩展视野，从更深更广的范围内探究语义的真正含义。

为了理清我们的思路，需要对前面讨论的几种语义研究方法梳理：
双语词典对应法：如果抽出语言的具体内容，我们看到对应实际上是世间人类认识世界的最基本工具，具有普遍意义。这一点我们以后会详谈；
单语词典定义法：定义，是我们学习新概念的基本方法之一，词典是用同义词、近义词或句子表示定义，以利于学习；但研究和学习不同，我们的目标是探究语义的本质，因此定义法需要改造，能够形式化，从定义的形式结构得到语义研究的启发。
实物展现法：是一种好方法，但并不总是很方便，无法应对一些抽象的事物和概念。
逻辑方法：逻辑方法的实质其实就是对应法，只是把这个方法精确化、形式化、符号化而已。不过面对自然语言千变万化的结构和语义表现逻辑方法实在太弱，不堪重任，需要加强。

第二，为了探究“语义”的本质，我们的视野就不能只局限于语言学，因为和语言学的其它对象不同，语义的实质，实际上是人们对这个世界的认识。一堆发面团，蒸熟了，半球状的叫馒头，拧个花叫花卷，那么馒头和花卷的“语义”一样吗？从物理角度，二者都是小麦粉发酵之后蒸熟的食品，物理属性完全一样，只是形状不同，就得到了不同的词汇描述。但是我的自行车被汽车撞烂，轮胎拧的跟花卷似的但仍然叫轮胎并没有什么专用词汇描述。这说明什么？

因此首先就会产生一个问题，我们的语言跟我们周围的世界是什么关系？什么是“我们周围的世界”？我们日常生活的环境当然算，网络世界算不算呢？红楼梦中的贾瑞贾大爷生活在“风月宝鉴”的世界里，天天跟凤姐颠鸾倒凤，算不算呢？金庸小说中描述了现实生活不存在但仍然让无数人撕心裂肺、哭天喊地的武侠世界算不算呢？西游记的神仙世界、妖魔鬼怪世界算不算呢？酷爱数学的人一头扎入那理性、和谐对称的美妙世界，回过头来再进入日常生活的现实世界，那对比之强烈无以言状，当他使用“极限”这个词时，你能明白它的语义吗？

所以，研究语义，先要选定一个参照系，这个参照系，左右着你全部语义理论（如果你真有理论的话）的基础。没有参照系语义是没有意义的。

例如：所有的人都要听我的！！

如果没有参照系，就无法理解这句话的“语义”：你是说全宇宙的人、包括外星人都要听你的呢、还是地球人包括奥巴马、普京都得听你的？或者全中国的人都要听你的？从逻辑学上讲，“所有”的语义是这样的：给定一个背景集合叫做“universe set”，“所有”的意思就是这个集合成员的全体。不过在现实生活中很少有这样理解的人，说这句话的人和听者有着一个共同的参照系：或许是工地上的工头对手下的工人。

什么学科研究参照系问题呢？逻辑学中的内涵逻辑（intensional logic）、包括模态逻辑（modal logic）和时态逻辑（temporal logic）。模态逻辑研究的是“可能世界”(possible world)和必然世界（necessary world），研究的是同一命题在不同的“世界”的不同真值问题；而时态逻辑研究的是在不同的时间段同一命题的不同真值问题。

刚才也提到了，语义说到底是人们对世界的认知问题。也就是说，我们使用的语言都是用来对应某一可能世界的对象（或称客体：object/entity）。土豆又叫做马铃薯，有些地方又称作洋芋。英语中，牛称作cattle/cow，但是宰杀后的牛肉则称作beef。这样看来语言和现实世界对象的物理属性无关，只和我们的另一个世界——概念世界有关。（关于这个问题可参见我在豆瓣【逻辑】小站的笔记《什么是【范畴】（一）》）

我们的概念世界，更多的不是语言，而是“印象”，“红色”就是我们对玫瑰、红宝石、血、樱桃的外观某一属性的印象，这是一种抽象：从这些物理属性不同的对象中抽取共同的东西；对红色、绿色、黑色等进一步抽象我们得到了“色彩/颜色”的印象。印象可以说是概念的一部分，只是这样的概念没有语言上的对应物——名称，而完全是视觉、听觉、嗅觉、味觉、触觉，甚至超感官知觉在大脑中的直接映射。中国人把这种情景称之为：“难以名状”，无法命名的状况（amorphous）。唐朝诗人崔护有一首诗，非常完美地诠释了我的这个陈述：

去年今日此门中，人面桃花相映红。
人面不知何处去，桃花依旧笑春风。

看到一个美丽的姑娘，没有姓名也没有来历，无奈只能用“人面”来代表，但诗人心中必然有一个栩栩如生的美女形象终生难忘，诗中的诉说只能是一个难以言状的“印象”（an amorphous mass of nebulous）的表述而已。

语言要表达概念世界（注意不是概念本身），首先要对这个世界中的对象“命名”，这个命名是一个约定俗成的过程，没有理性可言。问问你自己，你叫你现在这个名字，有什么非要叫这名字的理由吗？馒头花卷，是中国北方人的叫法，到了讲英语的世界，统称叫bun，而且不管是蒸熟的还是烤熟的，也不管形状如何。而在崔护的那首诗里，诗人只记住了让他终生难忘的那张脸，可能连姑娘穿的什么衣服带的什么首饰都不记得了（甚至很难用“一个姑娘”（佳人）来表述这个印象），这个印象只能凝缩在“人面”这个局部表达上。换句话说，当一个印象并不完整时，我们对它的指认只能是一个局部属性。当印象可以命名时，我们就有了语言概念——具有名称属性的概念。这个具名的概念可能只反映了相对应世界中对象的部分属性，而不是全部。关于这个问题我们后面还要谈到。所有这些概念的总和，以及它们之间的关系总和，就构成了我们的概念世界。

那什么学科研究概念世界呢？哲学。具体地说从亚里士多德的范畴论，到康德的概念体系再到胡塞尔的语义范畴，无一不是在对人类概念体系的探索和研究。而概念体系和语言之间的对应关系，更是语言哲学最关心的问题。

所以，对人类语言的语义本质进行深入探讨，首先要对哲学的中心问题——关于存在的问题有透彻地认识：人们所认识的周围世界与概念世界的映射关系就构成了哲学的一个分支：ontology（认识论、本体论），这个分支在进入新千年后发展很快，最大的进展就是它的形式化，现在已成为除机器学习等基于统计方法之外人工智能研究的另一大领域：ontology engineering（认知工程学）。而概念体系和我们的语言之间的映射关系也形成了一大分支——epistemology（知识学），主要研究概念的外在表达形式与语言的关系。语义学在很大程度上要受到这门学问的影响。

这些包括逻辑学、哲学、认知学、知识学等毕竟不是语义学，语义学的建立需要从这些学科汲取营养，就像婴儿喝奶一样，在有自主行动能力之前只能被动地吸收成熟学科的成果。而对于自然语言语义研究最有启发性的就是逻辑学中所定义的“语义”是一种对应关系，具体地说，就是原子命题、复合命题的集合和真值集合的对应关系。这种对应关系的形式化表达，就是函数。亦即：语义：命题 —— 真值，字母表示就是S：P —— T，或者S(P)= T

语义学既然是这种从语言学出生生长于其它学科的产物，那么它的理论如何表述呢？首先要声明的一点是，世界上尚未有成熟的语义学理论，更不存在唯一的语义学理论。目前比较靠谱的语义学，仍然是“寄居”在逻辑学领域，毕竟，逻辑学研究逻辑语义学——semantics已经有了上百年的历史，其中积累了许多成功的经验。Montague的做法就是：从现有的一阶谓词逻辑出发，先深入研究这些逻辑系统中和自然语言的对应物，也就是本文前面列举的那些“虚词/连词”，真正搞清楚什么是语义，在这个基础上在逐渐扩大研究范围。不过很遗憾的是，在这种研究框架中，没有词汇语义的研究，研究的只是结构语义。

在逻辑学研究语义的传统中，有几个人和事情是值得提及的。首先是一阶谓词逻辑的确立者弗雷格，德国数学家，他在研究内涵逻辑时，遇到了一个令人困惑的问题，对个体概念的命名问题。这个问题的实质就是上面提到的土豆/洋芋/马铃薯的问题。弗雷格的例子是金星：金星是太阳系中行星族中的一员，但是在地球上看时，因看到的时间不同，早上看到的叫做“晨星”、或叫“启明星”，晚上看到的叫暮星。弗雷格认为，任何一个代表唯一个体的名称，其名称是这个个体的指称（reference），也就是说，指称实际上是一种映射关系，R: ✨—— 金星。那么，晨星和暮星是什么呢？弗雷格认为，一个名称除了可以直接指称某一世界的对象外，还可以在概念世界找到对应，在这个概念世界中，相应概念是所指称对象的某些部分属性，而不是指称对象的全部，换句话说，这个概念更像是指称对象某一侧面的快照，同一对象不同侧面的不同快照就会产生不同的概念来。在马铃薯/土豆/洋芋的例子中，马铃薯是学名，可看做是指称，而土豆和洋芋可看成是对马铃薯某一侧面的快照，马铃薯是球根状植物，从土里刨出来成束状像豆子一样，从形状上看得到了土豆的名称，而另一些地方，将马铃薯比做本地产的芋头，由于是外来品，故称洋芋。因此，这些根据感官、经验认知得到的概念称作感知义。因此一个对象，用语言表达其语义时，和这个对象直接对应的概念称作指称义（reference：Bedeutung），而外部世界映射到概念世界时，就会产生一对多的情况：貌似不同的概念实际指称同一对象，这样的概念，称作感知义（sense：Sinn）。

第二个值得提及的，就是悖论问题，一个叫做逻辑悖论，一个是语义悖论。逻辑悖论谈论的比较多，如克里克岛说谎者悖论，集合论中某一集合包含所有集合的问题。语义悖论谈论的比较少，这里简单谈一下：所谓语义悖论是说某个句子的意义和其对应物——句子本身互相矛盾。举个例子：

（6）现在你看到这个编号为（6）的句子是由3个单词组成。

这个句子的指称对象是其本身，而这个指称又和句子的语义相矛盾。换句话说，当研究语义时如果这个语言对象的语义是指其本身，就有可能产生语言形式和语言意义不匹配的情况。

第三个，也是在我看来非常重要的就是波兰逻辑学派1930年代的研究工作。其中最引人瞩目的是阿伊杜凯维茨的句法连通性研究。阿伊杜凯维茨首先接受了胡塞尔关于语义范畴的概念，认为，逻辑研究的本质是要有一套通过句法映射语义的机制，称作句法联通；说白了就是，一个句子要语义通顺先要保证句法没问题。他首先从逻辑中抽取了句子和名称（就是语言学中的专有名词）作为句法的基本单位，并利用这两个基本单位构建逻辑语法中的其它概念。例如：太阳红，“太阳”是名称，“太阳红”是命题。那么“红”，作为属性，就可以从命题和名称构建：红 = 太阳红 / 太阳。这里的斜杠的意思基本上和分数中的横线一样，读作“太阳”分之“太阳红”，它的结果就是“红”。大多数人看到这里也许尚无法理解这个分数线的真正含义，直观地讲，拿分数作比喻：5/3 = 1 + 2/3，这个2正好是5-3的差，因此“太阳红 / 太阳”可理解为太阳红-太阳=红，或者将红看做是太阳x红/太阳的约分。

但这跟语义学有什么关系呢？我们知道，在一阶谓词逻辑中，其中最主要的概念就是三个：量词，属性和项（常项或变项）。除了量词外，用这种方法我们就可以只用命题和项来定义属性，这样属性就成了派生概念，这是逻辑学上的一大进步。现代数学、逻辑学追求的最高理想就是用最少最小最基本的概念定义整个知识体系。有了这个研究，语义学的重点就可以放在了对名称和命题这两个基本元素的研究，而其他范畴可以用这个算数公式派生出来。阿伊杜凯维茨的这个研究，后来经巴希勒尔（Bar-Hillel）和兰贝克（Lambek）的发展，成为现代最重要的语法学派之一：范畴语法。由于这种研究，可以把纯粹概念性的对象形式化，具体地说就是函数化，这就使得数学得以进入语义学的研究领域，而在这方面最突出的成就就是阿隆佐·丘奇（Alonzo Church）的lambda演算，所谓lambda模型就是从抽象的角度研究函数，抛开函数的数学属性，抛开函数的对应属性，抛开函数的计算属性，而只研究函数的抽象模型，使这个研究上升到一个类似哲学的高度，这样，使语义学研究从单纯地研究字面意思，开始向其语义的实质——对应关系转变。

现代的形式语义学，大多就是建立在这样的系统之上：
1.以范畴语法为句法框架
2.以Montague语义学——一个对现有逻辑进行了大幅扩充的广义逻辑系统：包括一阶逻辑、二阶逻辑、内涵逻辑、模态逻辑、广义量词、类型论（丘奇lambda演算的扩充形式）

我们将在以后的博文中介绍这些话题。

转载本文请联系原作者获取授权，同时请注明本文来自赛义甫科学网博客。
链接地址：https://blog.sciencenet.cn/blog-2349385-960635.html

上一篇：闲聊语义学
下一篇：卡尔纳普《符号逻辑及其应用导论》读书笔记书评（1）

收藏 IP: 70.77.203.*| 热度|

当前推荐数：2 推荐人：黄坚亮 taoshl

该博文允许注册用户评论请点击登录评论 (1 个评论)

数据加载中...

返回顶部

赛义甫

扫一扫，分享此博文

赛义甫的个人博客分享 http://blog.sciencenet.cn/u/saif 逻辑学、数学、计算科学、语言学和哲学——关于形式科学的思考

博文

再聊语义学

当前推荐数：2 推荐人：黄坚亮 taoshl

该博文允许注册用户评论请点击登录评论 (1 个评论)

赛义甫

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

赛义甫的个人博客分享 http://blog.sciencenet.cn/u/saif 逻辑学、数学、计算科学、语言学和哲学——关于形式科学的思考

博文

再聊语义学

当前推荐数：2 推荐人： 黄坚亮 taoshl

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

赛义甫

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

当前推荐数：2 推荐人：黄坚亮 taoshl

该博文允许注册用户评论请点击登录评论 (1 个评论)