||
[敬请读者注意] 本人保留本文的全部著作权利。如果哪位读者使用本文所描述内容,请务必如实引用并明白注明本文出处。如果本人发现任何人擅自使用本文任何部分内容而不明白注明出处,恕本人在网上广泛公布侵权者姓名。敬请各位读者注意,谢谢!
人工智能永无可能超越人类智能
程京德
本文(初稿,供讨论)试图一劳永逸地彻底解决“人工智能能否超越人类智能”这个问题,主要结论如题。
第一节 术语定义
先定义本文所使用的学术用语。
“智能”一词用于指称动物(注意,仅限定于动物)的辨识、认知、理解、记忆、模仿、学习、交流、规划、推理、问题求解等需要一般程度智慧的能力(在OED的“intelligence”词条中主要被定义为“The faculty of understanding; Understanding as a quality of admitting of degree; The action or fact of mentally apprehending something” [1])。笔者认为“智能”从学术上来说应该是属于神经科学/动物行为学/心理学/认知科学等多学科范畴的概念,各个学科研究“智能”的不同侧面。但是,“智能”从学术上来说不属于计算机科学或“人工智能”的学科范畴(无论“人工智能”是否包含在整个“计算机科学”之内);使用计算技术来研究(注意,是研究不是实现及应用)“智能”是相应学科内之事,如同计算物理和计算化学只不过是物理学和化学的分支而已。
“人类智能”一词用于指称人类作为高等动物包含了动物一般智能之外还进一步包含了的概念抽象、分析、计算、演绎、归纳、联想、猜想、预测、论证、概念推理等需要高等(亦即,基于概念抽象)程度智慧的能力。
“计算机”一词用于指称现代通用电子数字计算机,亦即,以第一台现代通用电子数字计算机EDSAC为代表的,具备有“程序控制,程序内存,程序可改”三个本质特征的,可以具有多个CPU处理器的计算机硬件设备(亦即,通称之“裸机”,但是,包括传统输入输出装置)。
“计算机系统”一词用于指称安装了系统软件以及应用软件的,能够执行其存储器中存储的计算程序来完成程序规定计算任务的计算机以及其它外部附属装置(的静态存在)。 其本质特征是在被启动之后能够根据输入计算机的每个计算程序来自动(亦即,无需人类参与)地完成程序规定的每个计算任务。对于通过通信网络连接在一起的一组计算机系统,亦即分布式计算机系统,在本文中视为一个整体与计算机系统不另做区分。
“运行中的计算机系统”一词用于指称在一个时间阶段内正在执行着某组(至少一个)计算程序,完成该组程序所规定的特定计算任务的计算机系统及其对系统外部显示出的“动态行为”。因为本文要讨论的是人类智能与“人工智能(下面定义)”之间的关系,所以,不考虑所有在计算过程中要求人类参与才能完成的交互式计算方式。
“解决问题”一词用于指称某个(某类)行为主体对于给定的某个(某种)问题找到解决该问题的方法并且用该方法实际解决了该问题,问题是否得到正确解决的判断是由该行为主体自身做出的。
“人工智能系统”一词用于指称能够执行为解决某个(某种)特定问题由人类设定了初始应用程序并且在完成任务时呈现出一定类似智能行为特征的计算机系统。这里,“人工”的限定意义在于该计算机系统执行的初始应用程序是由人类设定的,尽管在完成任务的过程中该系统也可能会执行由其自身自动生成的程序指令。
显然,如果把“计算”也视为一种智能行为,那么实际上任何计算机系统(初始程序当然是由人类设定)都是人工智能系统。本文关心的是那些可以呈现“计算”之外智能行为的人工智能系统。
作为一种能力(亦即,不是作为一个学科或领域)的指称,“人工智能”一词用于指称通过运行任何人工智能系统可以呈现出的所有能力。
需要说明的是,因为根本不存在完全不依赖于人类的计算机系统,所以,所谓“机器智能”是个从逻辑上从技术上都完全说不通的伪概念,本文不予考虑。
“人工通用智能(AGI)”,按照该领域文献 [2] 的陈述,“专注于人工智能领域最初雄心勃勃的目标 -- 创造和研究具有与人类相当甚至最终可能更高等的通用智能的软件或硬件系统 (focusing on the original ambitious goals of the AI field – the creation and study of software or hardware systems with general intelligence comparable to, and ultimately perhaps greater than, that of human beings.)。” “通用智能包括在各种不同的背景和环境中实现各种目标和执行各种任务的能力。一个通用智能系统应该能够处理与其创建者所预期的截然不同的问题和情况。一个通用智能系统应该善于概括它所获得的知识,以便将这些知识从一个问题或上下文转移到其他问题或上下文(General intelligence involves the ability to achieve a variety of goals, and carry out a variety of tasks, in a variety of different contexts and environments. A generally intelligent system should be able to handle problems and situations quite different from those anticipated by its creators. A generally intelligent system should be good at generalizing the knowledge it’s gained, so as to transfer this knowledge from one problem or context to others.)。”
按照我们上面的定义,在本文所要讨论的问题中,“人工智能”的涵义包含了“人工通用智能”,因为“人工通用智能”最终要在使用人工智能系统时才可以呈现出来。
“形式化”一词用于指称把某个(某种)问题/方法用某种形式逻辑学或者数学方法表达为符号方式,使得该问题/方法依据逻辑学/数学解释具有唯一确定的涵义。
“评价标准”一词用于指称在评价事物时用到的衡量准则,可以是定性的,被称为“定性评价标准”,也可以是定量的,被称为“定量评价标准”;实施评价的行为主体必须能够依据该准则实际可行地对被评价事物做出评价。
“评价事物”一词用于指称实施评价的行为主体依据确切的评价标准对被评价事物做出定性的或者定量的评价赋值。
第二节 问题设定
首先,对于“人工智能能否超越人类智能”这个问题,我们需要把它的内涵设定清楚。
由于任何人工智能系统运行时其初始程序是人类设定的,这就产生了一个问题,如何看待“人工智能”这种由人工智能系统呈现出的能力?这种能力显然不能说完全是由人工智能系统自身产生的,而应该是由人工智能系统基于人类智能(设定初始程序)借助高速计算技术所增强/放大的。所以,在此意义上更准确地说,“人类智能”与“人工智能”之间的比较,实际上是“人类的自然生物智能”与“人类智能借助高速计算技术被增强/放大了的智能”之间的比较。
如果仅仅考虑“计算”这种能力的话,从现代通用计算机诞生的第一天起,计算机的能力就早已“超越”(关于这种“超越”,下文还有分析说明)人类的能力了。
早在上个世纪70年代起,世界上就有过计算机(人工智能)能否超越人类的争论 [3,4]。 H. L. Dreyfus 的名著“What Computers Can't Do: The limits of artificial intelligence”[3] 被翻译为中文时,北大神童马希文教授在为中译本做序时就明确地阐明过 [3, 中译本序言]:
“计算机能不能代替人脑?这是一个十分含糊的问题。至少可以有以下几种很不同的解释:(1)计算机能不能完成一些迄今为止主要是靠人的大脑的活动完成的工作?(2)计算机能不能完成一切这种工作?(3)计算机能不能像大脑一样地完成这种工作?” “对于(1),回答是肯定的,这已有当前的社会实践所证实了。其实,自计算机发明之日起,它所做的一切工作一直是那些主要靠人的大脑完成的工作。 …… 除了可计算性(包括理论的和实际的可计算性)之外,几乎再也找不到一个合理的说法来为计算机的应用划定一个技术性的界限了。由于这种情况,只要稍不谨慎,就会陷入幻觉,以为计算机的应用并无界限,也就是说,对前面的问题(2)做出肯定的回答。这就是书中说的AI学派的论点。然而这是一种没有格局的外推,其中包含着不合理的逻辑跳跃。”
2016年初, DeepMind 的 AlphaGo 战胜人类围棋欧洲冠军以及世界冠军之后,2022年底,OpenAI 的 ChatGPT 发布之后,在全世界范围内两次掀起了各届人士都在声称“人工智能即将或迟早要超越人类智能”的热潮。尤其是这次 ChatGPT 的强大自然语言问答功能,更是使得某些人声称“人工通用智能已经或者即将实现了”。
笔者认为,现在应该对“人工智能能否超越人类智能”这个问题给与一个确切的回答,不要让某些所谓“专家”再继续误导民众,使得民众迷信“人工智能”能力无边,会超越人类智能,会对人类社会构成实质威胁了。
本文定义,“人工智能能够超越人类智能”是指:(1)针对每一个(一种)人类凭借自身自然生物智能能够解决的问题,都存在一个(一种)人工智能系统,通过运行该系统也可以解决该问题并且在有评价指标的评价项目上表现出比人类更好的特性;(2)在上面(1)人工智能系统解决问题的过程中,对问题解决之判断以及评价,是由人工智能系统自身做出的;(3)人工智能系统能够解决其自身设定而并非人类预先给定的问题,这些问题是人类凭借自身自然生物智能不能够解决或者即便能够解决其特性也不如人工智能系统的。
上述条件(1)是要求人工智能系统自身作为行为主体能够解决人类所能解决的全部问题并且解决的更好;条件(2)是要求人工智能系统自身作为行为主体做出问题是否解决的判断及评价;条件(3)是要求人工智能系统自身作为行为主体具备自主设定任务目标的能力。
注意,因为我们试图比较人类智能与人工智能,辨别和区分出行为主体是必要的,否则在概念上必然是混乱的。如果某个人工智能系统自身做不到解决问题与否的判断而必须由人类做出,那么,人工智能系统的人工智能何在?到底是人工智能系统强于人类还是“人工智能系统加上人类”才强于人类?
在这样的问题设定之下,本文将说明,对于人类能够解决的许多问题,由于人工智能系统的局限性,不可能存在人工智能系统可以解决它们,所以人工智能永无可能超越人类智能。
第三节 人工智能系统的局限性
首先,计算机系统在计算原理上的本质局限性是:任何计算机系统仅能够计算“可计算(可判定)”问题并在有限时间内给出确定的计算结果,不可能计算任何“不可计算(不可判定)”问题并在有限时间内给出确定的计算结果(完全不了解可计算性理论的读者,请参阅笔者公众号“数理逻辑与哲学逻辑”或笔者科学网博客上关于可计算性理论的科普文章)。因为任何人工智能系统都首先是计算机系统,所以,这当然也是人工智能系统的本质局限性。
由于计算机系统/人工智能系统的本质局限性,任何形式化的不可判定问题(可计算性理论教科书及专业文献中列举了许多已知的不可判定问题),都是在原理上不可计算的。
另一方面,如果一个问题可以用自然语言基本上陈述清楚,但是却还没有找到某种恰当的形式化方法将其形式化,那么,无论人类能否解决该问题,计算机系统/人工智能系统在原理上都不能够解决它。
这里,我们需要区分一下人类解决问题与计算机系统/人工智能系统解决问题之不同,亦即,人类解决问题的特殊性与计算机系统/人工智能系统解决问题的一般性。针对某个(某种)问题,所谓人类可以解决它,通常是意味着对于该问题的每个具体实例,人类都能够用(未必是可以完全形式化的、可能含有经验性手段的)某种方法予以解决,对于不同的具体实例可能使用的经验性手段也不同。亦即,人类解决问题的方法未必一定具有一般性而是依据具体情况具体分析的。而所谓计算机系统/人工智能系统可以解决某个(某种)问题,通常是意味着对于该问题的每个具体实例,计算机系统/人工智能系统可以用完全相同的、具有一般性的算法去解决它。实际上,计算机的高速计算能力当然是人类利用它来解决问题的缘由之一,另外一个缘由正是计算机系统解决问题的一般性方法(算法)。在没有发现/发明解决某个(某种)问题的一般性算法之前,我们通常不认为/宣称计算机系统能够解决该问题。针对一个问题具体实例的每个人类成功解决方案,当然是可以编制一个对应的特殊程序在计算机上模拟出相同结果的,但是,这种模拟,在实践上显然毫无意义。在实践上我们需要计算机系统做到的是,对于任意给定的问题具体实例,计算机都能够以完全相同的、具有一般性的算法去解决。
其次,一个形式化的问题在原理上是可以计算的未必意味着该问题在实践中就一定是“合乎应用要求”地可计算的。每个可计算问题的每个算法都有确定的时间复杂性(解决问题所需的计算步骤数量)及空间复杂性(解决问题所需的存储单元数量)。尽管在原理上是有限数量,如果解决某个(某种)问题所需的时间/空间从该问题的应用意义上来说巨大到无法认可,那么在实践上该问题就不是“合乎应用要求”地可计算的。
但是,任何一个(一种)问题的各个具体实例之解决未必需要同样的时间/空间。人类解决问题的特殊性使得人类可以根据每个具体实例的特殊情况选择适合该具体实例的(可能具有经验性质的)解决方法;而计算机系统/人工智能系统解决问题的一般性却没有这样的选择自由度,必须以完全相同的、具有一般性的算法去解决每个具体实例,故而针对不同实例会“有喜有忧”。
第四节 人工智能究竟能否超越人类智能?
目前,人工智能系统当然还没有能够解决人类所能解决的全部问题,问题是伴随着理论及技术的进步,今后会如何?人工智能系统是否迟早能够解决人类所能解决的全部问题?
由于人工智能系统在计算原理上的本质局限性,它们当然不可能解决任何不可计算(不可判定)问题。人类对付不可计算(不可判定)问题的办法是具体实例具体分析,尽量使用经验知识来解决。当然,人类基于经验解决不可计算(不可判定)问题的方法并不具有一般性,以此为由认为人工智能系统不能超越人类并不公平。
真正让人工智能系统难于超越人类的是那些没有被形式化的、难于被形式化的下面各类问题:
(1)创建新学问体系的问题:创建新逻辑学理论体系、新数学理论体系、或者其它新科学理论体系。毋庸置疑,创建新学问体系是拥有最强人类智能的少数卓越学者之所为,需要在逻辑学、数学、或者其它科学领域内的长期研究工作中发现以往学问的缺陷或不足、抽象并定义新概念、提出新原理或新基本假设、构建新学问体系的构架、指出新学问体系的发展方向。在逻辑学及科学哲学领域,试图归纳出科学发现过程的一般规律的调查研究已经进行了多年,至今也还未获得实质性结果。创建新学问体系的问题显然还不是一个能够形式化的问题,因此,尽管有众多人类智能的成功实例,还绝非人工智能系统能够解决的问题。
(2)在逻辑学/数学研究中创新的问题:定义新的逻辑学/数学概念、提出新的逻辑学/数学猜想、提出并证明新的逻辑学/数学定理;这些都是一般的逻辑学家/数学家们之日常研究工作。作为并非自然界原本存在的、通过人类智能的高度抽象归纳总结而成的逻辑学和数学,它们的共同特征是它们的高度抽象性(逻辑学比数学更为抽象),在逻辑学/数学领域的创造性工作需要高度的抽象思维能力。尽管逻辑学/数学之内容都是高度形式化的(亦即,容易被人工智能系统处理的),但是,因为逻辑学/数学领域的创造性工作时常需要基于直觉的“跳跃性”思维,其过程却是极其难于被形式化的。所以,在逻辑学/数学研究中创新的问题绝非人工智能系统能够解决的问题。
(3)在诸多科学研究中创新的问题:自然/社会科学家们直接或通过实验间接观察自然/社会现象、提出新的研究方向及课题、提出新的科学概念/猜想/假说/原理/定理/预测/试验方法、验证新的科学定理、提出新的科学评价标准、提出新的科学应用;这些都是一般的自然/社会科学家们之日常研究工作。与逻辑学/数学不同,因为涉及到观察和实验,诸多科学内容本身以及研究过程是极其难于被形式化的。所以,在诸多科学研究中创新的问题也绝非人工智能系统能够解决的问题。
(4)在诸多工程领域中创新的问题:工程师们发明新的技术、设想新的项目/产品并提出新的应用、根据客户需求设计新的项目/产品、根据设计编制且监督且实施施工/生产计划、验收项目/产品、维护项目/产品;这些都是一般的工程师们之日常工程实践工作。在这些工作当中,有相当部分是需要依靠工程师们的工作经验来完成的,亦即,难于被一般化形式化的,因此也是人工智能系统不能够解决的。
(5)在医疗、教育、经营、金融交易等实践中的经验主导问题:尽管现代医学开发了大量的测试检查方法,在不少测试检查项目上,人工智能系统已经能够完成得比人类还好,但是,医疗实践中的最终诊断还是由医生依据经验做出的。至于中医,就更是如此了。高等教育中的研究生教育,因为涉及到学术创新问题,导师个人及研究生个人的素质及经验对于教育效果极其重要。经营以及金融交易等实践中,经验也同样是至关重要的。所有这些人类社会生活实践中依赖于经验、由经验主导的人类智能行为,都不是能够被一般化形式化的,因此也是人工智能系统不可能具备的。
笔者在上面列举的这些问题,都是人类智能已经并且还将继续解决的,这一点无论怎么定义“人类智能”大概都是毋庸置疑的。这些人类智能行为的共同特征就是必须由具备某种主动的独创性的人方能够完成。而计算机系统在工作原理上恰恰不具备主动的独创性!人工智能系统当然也不具备!所以,我们设定问题的第三条要求,“(3)人工智能系统能够解决其自身设定而并非人类预先给定的问题,这些问题是人类凭借自身自然生物智能不能够解决或者即便能够解决其特性也不如人工智能系统的”,对于人工智能系统应该也是不可能的。
接下来,让我们探讨另一个方面,评价标准的建立及其使用的行为主体。
如前所述,如果仅仅注目于“计算”这种智能,计算机系统在计算能力方面早已单独地“超越”了人类。但是,因为任何计算程序对于计算过程(运行中的计算机系统)何时获得问题所要求正确结果之评价标准都是已经包含在人类发明并且预先给与计算机系统执行的算法当中的,运行中的计算机系统仅仅在按照程序指令执行计算过程时不断检查计算结果是否符合正确结果之评价标准而决定计算过程的终结,所以,对于计算问题解决与否的判断,不能说是完全由计算机系统作为行为主体自身完成的,而是基于人类给与的算法中给定的评价标准由计算机系统完成的。
关于人工智能系统“解决”问题,我们可以有与上述类似计算机系统计算问题的讨论。我们已经定义了“解决问题”一词用于指称某个(某类)行为主体对于给定的某个(某种)问题找到解决该问题的方法并且用该方法实际解决了该问题,问题是否得到解决的判断是由该行为主体自身做出的。我们还定义了“人工智能系统”一词用于指称能够执行为解决某个(某种)特定问题由人类设定了初始应用程序并且在完成任务时呈现出一定类似智能行为特征的计算机系统,“人工”的限定意义在于该计算机系统执行的初始应用程序是由人类设定的。所以,任何由人工智能系统“解决”的问题,对于问题解决与否的判断,不能说是完全由人工智能系统作为行为主体自身完成的,而是依据人类设定的初始应用程序由人工智能系统完成的。
因为我们本来就是比较人类智能与人工智能,既然我们定义了“人工”的限定意义,那么,如果人工智能系统根据人类通过初始程序设定的评价标准最终做出判定与评价就不应该是问题了,问题在于,如果人工智能系统完成任务的过程中执行由其自身自动生成的计算程序,其中的评价标准是如何设定的?
借用逻辑学/语言学中概念表达的层次用语,我们可以把在计算机系统中被执行并且输出最终结果的程序称为“目标程序”,将生成目标程序的程序称为“1阶元程序”,将生成1阶元程序的程序称为“2阶元程序”,…。显然,如果目标程序是被自动生成的,那么 包含在目标程序中的评价标准应该是由1阶元程序自动生成的,如果1阶元程序也是被自动生成的,那么,包含在1阶元程序中的评价标准应该是由2阶元程序自动生成的,余类推。
如果一个人工智能系统仅用人类设定的初始程序作为目标程序来解决问题,那么如前所述,其评价标准是由人类在初始目标程序中给定的。如果一个一个人工智能系统用来解决问题的目标程序是其自动生成的,那么,人类为其设定的初始程序必须是1阶、2阶、或某高阶元程序。
就笔者所知,现今计算机科学领域最成功的通用程序自动生成技术是compiler-compiler技术,亦即,给编译程序生成器输入某个目标语言的形式化文法描述,编译程序生成器自动生成该目标语言的编译程序,可直接被用于编译该目标语言的源程序。支撑compiler-compiler技术的是形式化文法及编译理论。目前应该还没有能够自动生成编译程序生成器的“2阶编译程序生成器”。
所以,以往由人工智能系统解决的问题,几乎(如果不是全部的话)都是由人类在初始程序中设定评价标准,由人工智能系统根据人类设定的评价标准做出判定与评价的,亦即,人工智能系统基于人类设定的评价标准“超越”了人类。今后,无论人类给人工智能系统提供的初始程序是多少阶的高阶元程序,其中必须包含生成低阶元程序所需评价标准的“元评价标准”。仅就笔者所知,理论计算机科学关于程序(及语言)理论的研究领域目前似乎还根本没有这个方向的工作。
另一方面,如果从人类社会进步发展的角度来看,所有由人工智能系统解决的问题的重要性/价值,最终还是由人类依据有可能进化的评价标准做出最终判断和评价的,没有(也不可能有)人工智能系统能够从人类社会进步发展的角度来判断和评价其自身解决问题的重要性/价值。
综上所述,笔者认为人类智能当中人工智能永远不可能超越的首先是概念抽象/创新/定义/推理,其次是评价标准建立,再次是基于经验的“灵机一动”思维跳跃。
最后,我们还需要澄清一个问题。伴随着理论及技术的进步,人工智能系统能否在将来具有类似于生物的自我意识、自己设定目标自己完成、像生物一样不断进化、能力越来越强大以至于在将来会“控制”人类?
笔者认为,上述问题的根本在于,人工智能系统能否具备自律进化的自我评价机制。无论生物的自律进化还是非生物的被动“进步”,要让事物向着优化的正方向进化/进步,一个可能需要不断修改评价标准的自律/被动评价机制是必不可少的。如果人工智能系统根本不具备主动的独创性、不具备自主制定评价标准的能力,那么它们如何可能具备自律进化的自我评价机制?当然是不可能的。
第五节 结论
人工智能系统不可能解决人类能够解决的全部问题,对于许多人类能够凭借自然生物智能解决的问题,不可能存在人工智能系统可以解决它们。以往和今后由人工智能系统解决的问题,其评价标准都是由人类设定,其重要性/价值还是由人类做出最终判断和评价,并非由人工智能系统自身设定评价标准由其自身做出最终判定与评价的。人工智能系统不可能具备自律进化的自我评价机制。
我们可以非常肯定地说,人工智能超越人类智能是永无可能的;让人工智能系统像生物一样不断进化、以至于在将来会“控制”人类的情形也是永无可能发生的。
另一方面,作为一种工具,人工智能技术和所有的工具一样当然具有双刃剑的特性。既然人工智能系统不可能作为行为主体做出超越人类的任何事情,那么,其哪一刃发挥怎样的作用便取决于谁作为行为主体出自什么目的利用它们做什么了。人类社会真正需要警惕的不是来自人工智能及其技术的危险,而是有些不怀好意的人们利用人工智能技术做出危害社会的事情却把责任推卸到本无责任能力的人工智能上去。
探讨完人工智能系统的极限能力,接下来我们应该探讨的是,如果人工智能系统在每个必要时刻都能够得到人类有效帮助,那么,“人工智能系统+人类辅助”系统的极限能力为何?
(2023年5月1日记)
参考文献
[1] The Oxford English Dictionary (OED), 2nd Edition, Oxford University Press, 2009.
[2] B. Goertzel, “Artificial General Intelligence: Concept, State of the Art, and Future Prospects,” Journal of Artificial General Intelligence, Vol. 5, No. 1, pp. 1-48, 2014.
[3] H. L. Dreyfus, “What Computers Can't Do: The limits of artificial intelligence,” 1972, 1979, MIT Press. [中译]:宁春岩译,马希文校,“计算机不能做什么:人工智能的极限”,三联书店,1986年.
[4] H. L. Dreyfus, “What Computers Still Can't Do: The limits of artificial intelligence,” 1992, MIT Press.
微信公众号“数理逻辑与哲学逻辑”
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-5 22:25
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社