信息学基础研究分享 http://blog.sciencenet.cn/u/geneculture 语言理解&知识表达

博文

AI和AGI的基础理论:序位逻辑、联动函数和基于数智文本的广义双语暨广义翻译所遵循的三大基本定律

已有 526 次阅读 2024-7-31 00:13 |个人分类:双语信息处理|系统分类:科研笔记

生成式AI与通用人工智能(AGI)基础理论最新研究成果综述

作者:邹晓辉(北京大学跨学科知识建模课题组特聘研究员)

949309225@qq.com

 

摘要:本文聚焦于生成式AI,作为当代人工智能(AI)与通用人工智能(AGI)典型代表,旨在深入探讨其基础理论方面的最新研究进展。方法通过对比分析传统AI与当代AI在底层逻辑、形式化理解上的差异,并进一步探讨传统AI的三个核心观点(符号主义、联结主义、行为主义)与当代AI三大流派(基于大型语言模型(LLM)的生成式AI/AGI,如ChatGPT;以小模型为特征的新质生产力AGI,如I3DNA;兼容大小两类模型的基于孪生图灵机双重形式化理解模型)之间的区别。结果揭示AIAGI基础理论的核心构成:序位逻辑、联动函数以及基于数智文本的广义双语与广义翻译所遵循的三大基本定律。意义在于:不仅增强了以ChatGPT为代表的基于LLM的生成式AI/AGI的可解释性,而且还为以小模型为特征的新质生产力AGI及其复杂的宇宙智能论和天下模型理论提供广义翻译,同时展示了孪生图灵机作为兼容并蓄的智能体在整合数据、知识、算力、算法及人机互助新时代认知范型的潜力,为构建超级智慧系统奠定了基础。

关键词 生成式AI、通用人工智能、底层逻辑、形式化理解、符号主义、联结主义、行为主义、大型语言模型(LLM)、新质生产力AGI、孪生图灵机、序位逻辑、联动函数、广义双语、广义翻译

关键词 生成式AI、通用人工智能、底层逻辑、形式化理解、符号主义、联结主义、行为主义、大型语言模型(LLM)、新质生产力AGI、孪生图灵机、序位逻辑、联动函数、广义双语、广义翻译

 

A Review of the Latest Research Achievements in the Basic Theory of Generative AI and Artificial General Intelligence (AGI)

Author: Xiaohui Zou  949309225@qq.com (Distinguished Researcher, Interdisciplinary Knowledge Modeling Research Group, Peking University)

Abstract: This paper focuses on generative AI, a typical representative of contemporary artificial intelligence (AI) and artificial general intelligence (AGI), aiming to delve into the latest research progress in its basic theory. The research method involves a comparative analysis of the differences in underlying logic and formal understanding between traditional AI and Current AI, further exploring the distinctions between the three core viewpoints of traditional AI (symbolism, connectionism, behaviorism) and the three major schools of Current AI (generative AI/AGI based on large language models (LLMs) such as ChatGPT; new quality productive force AGI characterized by small models, such as I3DNA; and twin Turing machines based on dual formal understanding models that are compatible with both large and small models). The research reveals the core components of the basic theory of AI and AGI: bit-list logic, linkage functions, followed by generalized bilingualism or generalized translation based on digital and intelligent text with the three fundamental laws. The significance of this research lies in not only enhancing the interpretability of generative AI/AGI based on LLMs represented by ChatGPT but also providing generalized translations for the new quality productive force AGI characterized by small models and its complex theories of cosmic intelligence and the universal model series. At the same time, it demonstrates the potential of twin Turing machines as inclusive intelligent agents in integrating data, knowledge, computing power, algorithms, and human-computer mutual assistance in the new era of cognitive paradigms, laying the foundation for constructing super intelligent systems.

Keywords: Generative AI, Artificial General Intelligence (AGI), Underlying Logic, Formal Understanding, Symbolism, Connectionism, Behaviorism, Large Language Models (LLMs), New Productive Force AGI, Twin Turing Machines, bit-list Logic, Linkage Functions, Generalized Bilingualism, Generalized Translation"

一、引言

随着人工智能技术的飞速发展,生成式AI作为当代AIAGI的重要分支,展现出了前所未有的创新潜力与应用价值。本研究致力于探索生成式AI及其所属AGI领域的基础理论最新成果,以期为该领域的深入发展提供理论支撑。[1][2]近年来,人工智能技术取得了巨大的进步,其中生成式AI作为当前AI和更广泛的人工通用智能(AGI)领域的一个重要分支,展现出了极大的创新潜力和广泛的应用价值。简单来说,生成式AI能够创造出新的内容,比如文本、图像或者音乐,这在很多领域都有着革命性的应用前景。本研究主要目标就是探索生成式AI及其所属的AGI领域在基础理论方面的最新成果,希望通过这样的研究,为这一领域的深入发展提供坚实的理论支持,推动其更好地应用于实际生活中。

二、传统AI与当代AI的底层逻辑差异

传统AI主要基于符号处理、模式识别与算法优化,其核心理念包括符号主义、联结主义和行为主义。而当代AI,特别是生成式AI,则侧重于数据驱动的深度学习模型,尤其是大型语言模型(LLM)的应用,实现了从规则驱动到数据驱动的根本转变[3][4][5]

1. 传统AI与当代AI(特别是生成式AI)的多因素平行比较

image.png

由表1可见,a核心理念与方法:传统AI主要基于符号主义、联结主义和行为主义,采用符号处理、模式识别和算法优化等方法。当代AI,特别是生成式AI,则侧重于数据驱动的深度学习模型,尤其是大型语言模型(LLM)的应用。b逻辑基础与处理方式:传统AI是规则驱动的,它依赖于预设的规则和模式进行推理和判断。当代AI是数据驱动的,它通过大量数据进行学习和自我优化,从而适应不同的任务和环境。c应用场景与优势:传统AI在专家系统、模式识别、算法优化等领域有广泛应用,并在特定领域和规则明确的任务中表现出色。当代AI在自然语言处理、图像识别、智能推荐等领域展现出强大的能力,特别是在处理复杂、多变的任务时表现出更强的适应性和学习能力。d挑战与展望:传统AI面临难以处理大规模数据和复杂任务的挑战。当代AI则需要大量数据和计算资源,并且存在可解释性差等问题,但其在未来的发展中仍具有巨大的潜力和价值。总之,传统AI与当代AI在底层逻辑上存在显著差异。传统AI主要是基于符号处理和规则驱动,而当代AI则侧重于数据驱动的深度学习模型。这种转变使当代AI在处理复杂、多变的任务时表现出更强的适应性和学习能力,但同时也带来了新的挑战和问题。

三、形式化理解上的差异

在形式化理解层面,传统AI倾向于构建明确的规则体系通过符号操作和逻辑推理实现问题求解。而当代AI则通过深度学习实现了对复杂模式的隐式理解与生成,这种转变不仅提升了处理复杂问题的能力,也带来了可解释性上的新挑战。[6][7]

2. 进一步阐述传统AI和当代AI在形式化理解层面上的区别

image.png

由表2可见,传统AI采用了类似决策树或流程图结构,表示其基于明确的规则和逻辑进行问题求解。当代AI则采用了神经网络的简化结构,表示其通过深度学习模型自动学习数据中的复杂模式。通过表2可看到传统AI和当代AI在形式化理解层面上的主要区别,包括其核心方法、实现方式、问题求解能力、处理复杂问题的能力等。

四、传统AI观点与当代AI流派的对比

    传统AI的符号主义、联结主义、行为主义三大观点,分别强调了符号操作、网络连接与行为模拟的重要性。相比之下,当代AI的三大流派展现了更加多元化与深层次的技术探索与实践

ChatGPT为代表的基于LLM的生成式AI/AGI,通过大规模语料库训练实现了自然语言生成与理解的能力

以小模型为特征的新质生产力AGI(如I3DNA),注重模型的高效性与实用性,在特定领域展现出强大的应用能力

兼容大小模型的孪生图灵机,通过双重形式化理解模型实现了对数据与知识的深度整合与智能处理[8][9][10]

3. 进一步阐述ChatGPTI3DNA以及孪生图灵机之间的区别

image.png

由表3可见,ChatGPT采用了类似神经网络的结构,表示其基于大规模语料库训练实现自然语言生成与理解的能力。新质生产力AGI(如I3DNA)采用了简洁的模型结构,表示其注重高效性与实用性,尤其是在特定新质生产力领域展现出强大的应用能力。孪生图灵机采用了双重模型结构,表示其通过双重形式化理解模型实现对数据与知识的深度整合与智能处理。通过表3可看到ChatGPT、新质生产力AGI(如I3DNA)及孪生图灵机在核心特点、模型规模、计算资源消耗、通用性、应用领域等方面的区别。

对比分析ChatGPT为代表的基于LLM的生成式AI/AGI,其核心特点:通过大规模语料库训练,实现了自然语言生成与理解的能力。优势:在自然语言处理领域具有广泛的应用,如对话系统、文本生成、语言翻译等。局限:对于特定领域的深入理解和应用可能相对较弱,且模型规模较大,计算资源消耗较高。以小模型为特征的新质生产力AGI(如I3DNA,其核心特点:注重模型的高效性与实用性,在特定领域展现出强大的应用能力。优势:模型规模较小,计算资源消耗较低,便于在特定领域进行快速部署和应用。局限:可能缺乏通用性,对于跨领域的任务处理可能相对较弱。兼容大小模型的孪生图灵机,其核心特点:通过双重形式化理解模型实现了对数据与知识的深度整合与智能处理。优势:兼具大模型的通用性和小模型的高效性,能够在不同领域和任务中展现出强大的处理能力。局限:模型结构的背景知识相对复杂,需要较高的理论和技术水平和计算资源来进行训练和优化。

五、AIAGI的基础理论

研究揭示了序位逻辑、联动函数作为AIAGI基础理论的核心要素。序位逻辑关注智能体在处理信息时的序列与位置关系,而联动函数则描述了智能体内部各组件之间的相互作用与影响。此外,基于数智文本的广义双语与广义翻译所遵循的三大基本定律为深入理解与推动生成式AIAGI的发展提供了重要的理论基础。[11][12]

下面结合文字、公式、图形和表格全面阐述数智文本及特征:

数智文本概述数智文本是通过数字和文字的双重形式化方法与双重计算模型严格定义的文本类型。它遵循特定的数字ID和汉字(单音节的汉语(即多音节的遵循双重进制规则,并通过孪生图灵机和冯氏机实现数字化和智能化。进一步阐述如下:

数智文本是由数字和文字(中文的言和语的关系数据库定义的)双列表以双重形式化方式方法与双重计算模型严格定义的。特征在于:遵循P进制的数字ID和遵循Z进制的汉字(单音节的言)以及字组(多音节的语)借助孪生图灵机实现数字化进而借助一系列的冯氏机而实现智能化(三类形式化理解模型)。由此定义了广义双语和广义语言(字式图表音像立活)及其双重形式化数智文本,其特征是:基本元素(对象语言)及其被调用而建构所派生的各级元组(形式化组合逐级派生的解释语言暨元语言)均满足(1)异义排列唯一守恒(简称:义),(2)同义并列对应转换,(3)同意并列对应转换三大基本法则。其中,法则(1)是序位逻辑法则,法则(2)是联动函数法则,法则(3)是广义翻译法则。这里的义是义项的义

以下是一个简单的图形,表示数智文本中基本元素和派生元组之间的关系,以及它们如何遵循三大基本法则:

image.png 

1. 数智文本中基本元素和派生元组之间的关系,以及它们遵循的三大基本法则

1可见,它形展示了数智文本中基本元素和派生元组之间的关系,以及它们如何受到三大基本法则的约束。通过这种方式,可理解数智文本的复杂性和其背后的理论体系

数智文本言和语的关系数据库由数字和文字双列表定义的广义双语进而至广义语言字、式、图、表、音、像、立、活基本元素(对象语言)及其派生的元组(解释语言暨元语言)均满足三大基本法则1异义排列唯一守恒序位逻辑法则)公式:对任意两个义 a  b,它们在排列中的顺序位置 p(a)  p(b) 是唯一且不同的标识。如果 a=b,则 p(a)=p(b)于是引出2同义并列对应转换(联动函数法则)公式:对任意两个相同义 a  a′,它们可不同的表示 r  r′ 并在它们相互之间进行对应转换,如果 a≈a′,则存在转换函数 f 使 f(a,r)=(a′,r′)进而引出3同意(选择用意)并列对应转换(广义翻译法则)公式:与2类似但不同不仅强调在不同语境或表示之间的转换而且,更进一步明确了不同主体及代理(智能体)的选择用意(既可约定,也可规定)。即,如果 a  a′ 在不同语境下表示相同或相近的意义+,则存在转换函数 g 使得 g(a,c)=(a′,c′),其中 c  c′ 表示不同的语境下具体的选择用意

4. 通用人工智能AGI(孪生图灵机)遵循的三大法则

image.png

由表4可见,三大基本法则的通俗化概述和公式说明。以下是结合公式、表格和图形对两个刚性的法则做进一步阐述:

研究揭示序位逻辑与联动函数作为AIAGI基础理论的核心要素。具体而言,序位逻辑(Sequential Logic or The Logic of Sequence and Position or Bit-List Logic)聚焦于智能体在处理信息的序列与位置的逻辑关系,它描述了智能体如何根据信息的顺序和位置来做出决策和推理。而联动函数Interaction Function)描绘了智能体内部各组件间的相互作用与影响,它揭示了智能体内部不同部分之间的复杂关系和动态交互。为更深入地理解这些概念,可以采用以下公式进行表示:

序位逻辑公式:SL = f(S, P)

其中,SL表示序位逻辑S表示信息的序列,P表示信息的位置。

联动函数公式:IF = g(C1, C2, ..., C n)

其中,IF表示联动函数,C1, C2, ..., C n表示智能体内部各个组件。

5.总结了序位逻辑和联动函数AIAGI发展中的重要性

image.png

基于数智文本的广义双语与广义翻译所遵循的三大基本定律,为深入理解并推动生成式AIAGI的发展提供了重要的理论基础。这三大基本定律可用图1进行表示

综上所述,序位逻辑、联动函数以及基于数智文本的广义双语与广义翻译的三大基本定律共同构成了AIAGI发展的重要理论基础。通过深入研究这些概念和定律,可以更好地理解和推动生成式AIAGI的发展。

六、研究意义与展望

本研究不仅增强了生成式AI的可解释性,而且促进了新质生产力AGI理论的广义翻译,进而还展示了孪生图灵机在整合多元智能要素、构建超级智慧系统方面的潜力。未来研究将进一步探索这些基础理论在实际应用中的转化路径,以期推动人工智能技术的全面进步。[13][14]本研究的意义重大,它不仅让我们更好地理解了生成式AI的工作原理,进而增强了其可解释性,还推动了人工通用智能(AGI)理论的广义翻译,使这一领域的研究更加深入。更重要的是,研究还展示了孪生图灵机在整合各种智能要素、构建超级智慧系统方面的巨大潜力。[15][16] 简单来说,这项研究不仅有助于人们更深入地理解生成式AIAGI而且还为未来构建更智能的系统提供了理论基础。它有望推动人工智能技术在更多领域的实际应用,带来全面的技术进步。[17][18] 展望未来,将继续探索这些基础理论在实际应用中的转化路径,努力将前沿技术转化为实际生产力,推动人工智能技术的全面进步。目标是让这些智能技术更好地服务于社会,为人们的生活带来更多便利和惊喜。[19][20]

致谢

致谢北京大学跨学科知识建模课题组和国内外通用人工智能技术前沿的探索者们!

参考文献:

1. Russell, S. J., & Norvig, P. (2020). Artificial Intelligence: A Modern Approach. Pearson.

2. LeCun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. Nature, 521(7553), 436-444.

3. Chomsky, N. (1956). Three models for the description of language. IRE Transactions on Information Theory, 2(3), 113-124.

4. Rumelhart, D. E., Hinton, G. E., & Williams, R. J. (1986). Learning representations by back-propagating errors. Nature, 323(6088), 533-536.

5. Brooks, R. A. (1991). Intelligence without representation. Artificial Intelligence, 47(1-3), 139-159.

6. Bengio, Y. (2009). Learning deep architectures for AI. Foundations and Trends in Machine Learning, 2(1), 1-127.

7. Silver, D., Huang, A., Maddison, C. J., Guez, A., Sifre, L., van den Driessche, G., ... & Hassabis, D. (2016). Mastering the game of Go with deep neural networks and tree search. Nature, 529(7587), 484-489.

8. Bommasani, R., Hudson, D. A., Adeli, E., Altman, R., Arora, S., von Wauth, S., ... & Liang, P. (2021). On the opportunities and risks of foundation models. arXiv preprint arXiv:2108.07258.

9. Hinton, G. (2021). The forward-forward algorithm: Some preliminary investigations. arXiv preprint arXiv:2112.02408.

10. Chollet, F. (2019). On the measure of intelligence. arXiv preprint arXiv:1911.01547.

11. Kaplan, A., & Haenlein, M. (2019). Siri, Siri, in my hand, who’s the fairest in the land? On the interpretations, illustrations, and implications of artificial intelligence. Business Horizons, 62(1), 15-25.

12. Tegmark, M. (2017). Life 3.0: Being human in the age of artificial intelligence. Knopf.

13. Marcus, G. (2022). The next decade in AI: Four steps towards robust artificial intelligence. arXiv preprint arXiv:2202.07218.

14. Shoham, Y., Perrault, C., Brynjolfsson, E., Clark, J., Etzioni, O., Grosz, B., ... & Slonim, A. (2022). Artificial intelligence index 2022 annual report. Stanford Institute for Human-Centered AI.

15. Zou X .(2023). New Opportunities for AI Innovation with Big Data: Indirect Docking between GLPS and LLM[C]2023 6th International Conference on Artificial Intelligence and Big Data (ICAIBD).

16. Zou, X. ,  Zou, S. , &  Wang, X. . (2019). The Strategy of Constructing an Interdisciplinary Knowledge Center. The International Conference on Natural Computation, Fuzzy Systems and Knowledge Discovery. Springer, Cham.

17. Zou, S. ,  Zou, X. , &  Wang, X. . (2018). How to Understand the Fundamental Laws of Information. International Conference on Cognitive Systems and Signal Processing. Springer, Singapore.

18. Maimaiti, M. ,  Zou, S. ,  Wang, X. , &  Zou, X. . (2019). How to Understand: Three Types of Bilingual Information Processing?. International Conference on Cognitive Systems and Signal Processing.

19. Zou, X. ,  Zou, S. , &  Wang, X. . (2019). New Approach of Big Data and Education: Any Term Must Be in the Characters Chessboard as a Super Matrix. International Conference on Big Data. ACM Press.

20. Lv Chenjun,&Zou Xiaohui. (2020). A Preliminary Study on the Mathematical Basis of General Artificial Intelligence. Research on Dialectics of Nature, 36(3), 7.吕陈君, & 邹晓辉. (2020). 通用人工智能的数学基础初探. 自然辩证法研究, 36(3), 7.

附录:草稿

AI和AGI的基础理论:序位逻辑、联动函数和基于数智文本的广义双语暨广义翻译所遵循的三大基本定律

生成式AI是当代AI和AGI的典型代表。本研究旨在介绍它们的基础理论方面的最新研究成果。其方法是:首先,研究传统AI和当代AI在底层逻辑上的区别,进而,研究其在形式化理解上的区别,最后,研究传统AI的三个观点(符号主义、联结主义、行为主义)与当代AI的三大流派(最热门的生成式AI以ChatGPT为代表的基于LLM的生成式AI或AGI,另外还有两个分别是以小模型为特征的新质生产力AGI如I3DNA,和兼容于大小两类模型的基于双重形式化理解模型暨孪生图灵机)的区别。其结果是:发现了AI和AGI的基础理论,即:序位逻辑、联动函数和基于数智文本的广义双语暨广义翻译所遵循的三大基本定律。

其意义在于:一方面,不仅可增加生成式AI以ChatGPT为代表的基于LLM的生成式AI或AGI的可解释性(化黑箱为白箱),另一方面,还可做以小模型为特征的新质生产力AGI如I3DNA​及其所依托的超级复杂的宇宙智能论和天下模型的系列的庞大的理论的广义翻译,再一方面,其自身即兼容于大小两类模型的基于双重形式化理解模型暨孪生图灵机​所具有的特性及其可把数据、知识、算力、算法、人机互助新时代的认知范型统筹兼顾的超级智能体,整合成为可驾驭它们的超级智慧系统。​​​​​



https://blog.sciencenet.cn/blog-94143-1444479.html

上一篇:对融智学的一种深刻而富有创意的理解
下一篇:哲学、科学和融智学三者的区别与联系
收藏 IP: 116.31.52.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-9-20 18:04

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部