XLiblog的个人博客分享 http://blog.sciencenet.cn/u/XLiblog

博文

与师生谈人工智能3:精确定义之病

已有 4369 次阅读 2021-3-30 12:49 |系统分类:教学心得

学:学生,教:教师,李:李晓榕

教:不给定义就讨论,我们浑身不自在。

李:是啊,我们都被洗脑了,科研工作者更是如此。太爱下定义(旧称“界说”),是西方学术界的宿疾,早已蔓延全球。在《生活的艺术·思想的艺术·回向常识》中,林语堂调侃这个毛病说:“人的爱好字句,是他走向愚昧之途的第一步,他的爱好界说乃是第二步。他越从事于分析,他越需要界说,他越加定界说,他越是趋向一个不可能的逻辑的完美境界,因为乞求逻辑的完美就是愚昧的迹象。因为字句是我们思想的材料,所以定其界说的企图乃是完全可嘉的,于是苏格拉底在欧洲创始了一个定界说狂。其危险在于我们意识到曾由我们定其界说的字眼时,便不能不将用以定界说的字眼也定出它们的界说来,因此,其结果除了用以定生活的界说的字眼以外,我们又有了专用以定别的字眼的界说的字眼,而定字眼的界说这桩事便成了我们的哲学家的主要成见了。忙碌的字眼和空闲的字眼之间显然有一种分别,前者在我们的日常工作生活中尽它们的责任,而后者只存在于哲学家的研究团体中。”

   无独有偶,西方意象诗派开山大师庞德说得到位1在欧洲,如果要人给出定义,他的定义总是离开他所完全了解的简单事物,渐行渐远,进入一个未知地带,即一个越来越偏远疏远间接的抽象地带。所以,如果要他定义红色,他会说是一种颜色。问他什么是颜色,他会说是光的折射或振动,或者是光谱的一段。问他什么是振动,他会说是能量的一种模式,如此这般,直到达到超出你和他所能掌握的某种存在或非存在的形态特征。我在网上看到如下定义:“手,人使用工具的上肢前端。”让我笑得喷饭。照理,一个好的定义,其定义项的含义应该比被定义项的易懂、显豁、通俗,否则都有过度定义之嫌。对于大多数像我们这样的讨论,难道“血的颜色就是红色,国旗的颜色也是红色”这类举例说明的“不精确定义”不如上述振动或光谱的“精确定义”?

   现代的一个时弊是本质主义,以为任何事物都有唯一的本质,定义就是把握、表述这个本质。热爱定义是现代西方理性主义的特征,源于古希腊的苏格拉底。这也充分体现于集合的内涵定义(即靠描述性质来定义一个集合,以区别于罗列集合元素的外延定义)。其实,一个集合之所以成为一个集合,未必因其元素都有统一而有别于其他集合的独特本质,也可能在于集合元素之间有某种特殊的关系,比如当代大哲维特根斯坦所说的“家族相似性”,即存在相互交叠的相似性,而未必都两两相似。这就像机器学习中的聚类(clustering,见图):大量相近的点构成一个环,尽管环内的每对点未必都很相近(例如, A点和B点相距甚远),但每个点都有环中的多个相邻点(家族相似性),否则不属于此环(比如环心水平点集之点)。一个靠“家族相似性”构成的集合,更一般地说,一个靠元素间相互关系来定义的集合,大都无法靠本质主义的定义来精确划界。这样的定义,一般难以精确。一个典型例子是生物物种。它被定义为这样一群生物:其成员能交配繁殖同种后代,即后代也能与其他成员繁殖同种后代。比如,马跟驴虽能生骡,但骡是不育的,不能跟马、驴交配产子,故马、驴、骡不属同一物种。美国加州的埃氏蝾螈有六类:E1↔E2↔E3↔E4↔E5↔E6,每类都能且只能与其“最近邻”直接交配产子(记为“↔”)。一般认为它们都是埃氏蝾螈这个物种的亚种。然而,按这种基于家族相似性的连锁推理逐代回溯,现代人无疑与几百万年前的远祖属于同一物种,而这些远祖也是黑猩猩几百万年前的远祖,所以人与黑猩猩属于同一物种!这就像图中的A点和B点同属一环。再上推几亿年,人与蝙蝠同为哺乳动物也有同种远祖,所以也属于同一物种!更进一步,所有靠交配繁衍的生物都只能是同一物种!这让人想起著名的“沙堆悖论”(或者“秃子悖论”、“忒修斯之船悖论”等):沙子的一个集合是否构成沙“堆”,不会因为增减一粒沙子而改变,但从一堆沙中不断减去一粒,最终一无所有,肯定不再是一堆沙。基于家族相似性的定义,大都有此潜在问题。可见,不能毫无限制地滥用连锁推理。关键是,并不存在合理的精确界线或精确定义。

image.png

学:谢谢李老师,我们的确深受本质主义影响,这个“家族相似性”让我受益匪浅。

李:是啊,凡事都想追究其本质是什么。甚至面对《红楼梦》这样百科全书式的文学作品,也想要追问其本质内涵究竟是什么,结果才会出现鲁迅所嘲讽的那样以偏概全:在《红楼梦》中,“经学家看见《易》,道学家看见淫,才子看见缠绵,革命家看见排满,流言家看见宫闱秘事……”。人们对歌德的大名著《浮士德》,也是如此。

   一个系统含有两大类主要构成:元素和关系。借此数学概念,可以说,现代西方文化更是“元素”文化,中国传统文化更是“关系”文化。借用“粒子”和“场波”的物理概念,可以说,现代西方文化和中国传统文化的核心分别是“粒子”和“场波”,

现代西方有“粒子元素”传统,传统中国有“场云关系”传统。

西方传统的“粒子元素性”有多方面的表现:个人主义,独立存在、与他人关系较少,追求本体、本源,追求确定性,重视精确定义,注重对象分解和粒子研究,等等。中国传统的“场云关系性”也很明显:人与人的关系、人与自然的关系是一种无所不在的“气”“场”,个人的价值主要体现在“关系场”中,注重整体的协调合作,三纲五常所关心的主要是人际关系和社会秩序这些“场”,中国文化所特有的“气”的表述也与“场”根本相通,比如认为生命的本质是“气”,等等等等。早先说过,现代西方思维是线式思维,中国传统思维是圈式思维;还说过,“粒子”与“场波”的关系跟“离散”与“连续”的关系大有相通之处。我们知道,圆周运动与正弦“波”在数学上是等价的,而光粒子是沿着直线(短程线)运动的。光的粒子说和波动说长期存在且彼此相争,大有你死我活之势,直到量子力学的建立,才调和统一了它们。Richard E. Nisbett, The Geography of Thought:How Asians and Westerners Think Differently…and Why(可译为《思维的地缘性》)一书说:心理测试表明,中国人和美国人所能回忆起的字词数量,在不与社会背景相连时没有差别,而在相连时,中国人能回忆更多字词,说明中国人更在意社会暗示;4岁到6岁的儿童关注自己的言行的时间比例,美国儿童比中国儿童大二三倍;要将鸡、牛、青草归类,中国小孩更重视相互关系,大多把牛和青草归为一类(牛吃草),鸡为另一类;而美国小孩更重视实体范畴,大多把牛和鸡归为一类,青草为另一类。类似地,面对熊猫、猴子、香蕉,美国大学生大多认为猴子和熊猫更接近,而中国大学生更倾向于认为猴子和香蕉更接近。现代以来,西风东渐,中国人也日渐重视精确定义。

   现代西方文化的一大基础和力量源泉是科学理性,其主要对象是硬科学所适用的物质对象和自然界,它们易于且宜于精确;中国传统文化主要关注人际关系和精神世界,难以而不宜精确。精确定义就是一种精确划界。粒子、元素、单位等可以清晰划界,便于精确定义,所以“粒子”传统与精确定义联系密切,比较契合;而气、场、云之类的对象难以精确划界。上述科学、技术、社会、文化、物质、精神、生命、心智、智能、意识、复杂性等概念,其实都是这种“概念云”而非“概念子”,无法精确划界。正因如此,任何一门非硬科学的现代学问,其中的重要特别是关键概念,大都足够复杂,因而都有大量各不相同的定义。所以“众说纷纭,莫衷一是”的情形随处可见,大量学者把聪明才智浪费于此。怪不得唯一两次独享诺贝尔奖的鲍林(Linus Pauling)会有感慨:“给事物下定义,有时比研究一个问题还难。”总之,精确定义(更一般地说,追求精确)这个硬科学的利器,在硬科学之外并不有效好用。过度追求精确定义是西方学术宿疾。把一个原本不错的东西用于其适用范围之外,是一大谬误。过度追求精确,就是这种谬误。我说的这些,都与早先所说的“思维不精确原理”或“想不清原理”以及“精确性的终结”一脉相通,如有兴趣,可以回顾。

教:李老师说得很有道理。不过我想,追求精确定义虽然可能有种种问题,但是总体来说还是给我们带来了很大进步。比如,智力很复杂,但是智商测试很简单,它给我们提供了一个把握智力这个复杂概念的简单手段。

李:是啊,这种简化必不可少,且到处都是。比如,把一个国家的经济发展水平归结为GDP的大小;把国民的幸福程度简化为“幸福指数”的高低;许多领导都把一个单位总体情况的好坏,简化为简单“抓手”的度量。从一方面来说,确立这样一种合理有效的综合指数,的确是一种进步。在一些场合下用这些指数,无可厚非,但要深知它们都难免有过于简化的固有缺陷和局限,不得滥用。更关键的是,不能太过关注它们、把它们作为奋斗目标,更不能大力优化它们。遗憾的是,很多人包括领导都这样犯傻。这种偏执是走火入魔,会适得其反,带来“表面光”而“本质烂”的退步。各种复杂事物的简化指标,都有被滥用这种恶果。

   智商测试的确是一个典型例子,特别是在谈论智能之时。时至今日,在人们心目中,智力差不多就是智商,而智商,按定义就是智商测试的结果,所以智力水平差不多就是智商测试的分数高低。其实,智商测试原本是用来测试学童,以预测其未来的学业成绩。这比较合理可行。然而,因定量地把握智力之需,其结果被广泛用来度量智力,却无视这样做以偏概全的本质。现在竟然发展到如此地步,以至于有一种相当流行的智力定义:智力不是别的,正是智商测试所测试的东西。(照此,幸福不是别的,正是幸福指数所反映的内容;经济水平不是别的,正是GDP的高低。)其实,智商测试的分数高低未必很好地反映智力水平,它测试的“一般”能力,与受教育程度等因素有强相关,比公认的智力狭窄得多 。智力含括广泛,构成复杂,很难相信存在任何简单测试能正确反映其真实全貌,判定优劣。根据史料,最伟大的科学家牛顿、达尔文、爱因斯坦等人少年时如果测试智商,都不会高。用片面的智商测试来度量智力,就像历史上布罗卡、高尔顿等人用脑的轻重、大小、脑商等片面指标来度量智力,进而论证人种优劣的丑闻一样,都有“攻其一点,不及其余”的偏狭,不足为训。鉴于这种片面测试泛滥成灾,带来种种问题(比如用来比较种群的优劣),有些知识精英甚至呼吁禁止智商测试。


______________________________

1. Ezra Pound, ABC of ReadingIn Europe, if you ask a man to define anything, his definition always moves away from the simple things that he knows perfectly well, it recedes into an unknown region, that is a region of remoter and progressively remoter abstraction. Thus if you ask him what red is, he says it is a 'colour'.  If you ask him what a colour is, he tells you it is a vibration or a refraction of light, or a division of the spectrum. And if you ask him what vibration is, he tells you it is a mode of energy, or something of that sort, until you arrive at a modality of being, or non-being, or at any rate you get in beyond your depth, and beyond his depth.


正在出的博文系列:

与师生谈人工智能:

1.智乎哉?    2. 奢求精确之误    3.精确定义之病

 

与师生谈现代化之弊

1:崛起的代价     2:发展必好无疑?    3:发展的恶果     4:科技进步果真进步?         5:科技的罪责 

6:开发进步善哉恶哉?7:现代化恶果之因    8:现代化恶果之因2  9:资本主义与个人主义   10:资本主义的修正与回潮

11:全球化的好歹   12:全球化的好歹     13:西化、现代化、全球化 14:现代化的本质      15:文化全球化?

16:妈的奶贼腥        17:多元优越             18:四大主义      19:“化私为公”的隐形手   20: 进步的魔咒

21:进步的陷阱    22:进步的后果       23.成功的反噬     24:进步的残酷                  25: 进步到恶神末日

26:自造成恶神

 

与师生漫谈科研文化

1:我有科研之才吗?  2:我该做科研吗? 3:逻辑推理的作用 4:人生价值     5:生命的延续           

 

已出博文系列:

与师生谈科学之弊

1:线式因果思维1      2:线式因果思维2     3:线式因果思维3         4:螺环之奇妙                 5:幻化的因果 

6:不牢靠的因果推理        7:分析还原病       8:还原论教条                    9:基因未必基因      10:割根裂本

11:强拆硬分        12:科学的领地       13:科学的致命伤         14:科学的致命伤2           15:逻辑之可错

16:逻辑可错之源       17:“脚踏实地”的逻辑?18:逻辑:真理焉?宗教焉?       19:想不清原理       20:想不清原理2

21:逻辑教的改革    22:逻辑教的改革2     23:精确性的终结         24:科学哲学                  25:务外逐物 

26:科学六弊                 27:科学之弊总结

 

与师生谈科研选题:
1:科研的战略、战术和战斗力 2:选题三准则:趋喜避厌 3:选题三准则:如何培养兴趣 4:选题三准则:择重舍轻,扬长避短

5:得题之关键           6:如何应对新潮      7:选题四建议          8:总结:选题好比找对象

 

与师生谈研究策略:

1:科研四要素    2:突出重围的法   3:人人信之而善忘的黄金法则  4:孤胆方是英雄,独创才有真才  5:大道至简,科学之魄

6:弃繁就简     7:以特制胜      8:综括               9:反行众道,改形换状       10:迷雾中的灯

11:技穷时的上策 12:驾驭时间之术1  13:驾驭时间之术2     14:保质增产之法          15:类比、联想、猜测、推证 

16:评估       17:总结与回顾

 

与师生谈学习门径:

1:广度与深度      2:增加深度的窍门1    3:增加深度的窍门2      4:增加深度的窍门3  5:增加深度的窍门4

6:增加深度的窍门5  7:增加深度的窍门6        8:如何培养直觉和想象力? 9:基础不好,死路一条?10:阅读策略1

11:阅读策略2      12:博览之术           13:增强记忆1          14:增强记忆2      15:如何听讲 

16:最佳捷径

 

与师生谈科研输出:

1:论文写作五要点 2:论文的结构、条理和语言 3:标题、摘要、引言、结论  4:作学术报告四建议  5:与编审人员打交道

 

与师生谈科研道德:

1:何谓弄虚作假              2:何谓剽窃?             3:何谓自我剽窃?               4:版权

5:谁该当作者?              6:署名顺序怎么定?        7:其他学术不当行为              8:总结




https://blog.sciencenet.cn/blog-687793-1279300.html

上一篇:与师生谈人工智能2:奢求精确之误
下一篇:科研体制的大修2:众人参与的主客观评估
收藏 IP: 174.67.139.*| 热度|

3 庄朝晖 王林平 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-21 23:55

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部