信息学基础研究分享 http://blog.sciencenet.cn/u/geneculture 语言理解&知识表达

博文

科学研究需要几十年如一日的持之以恒的探索历程

已有 159 次阅读 2025-12-2 14:59 |个人分类:学术研究|系统分类:科研笔记

时隔近19年了,现在回过头来把融智学后续这19年多的长足进步及其发展成果充实进来撰写一篇论文!

这是一篇基于我2007年《信息学基础研究》论文,并结合过去近十九年来融智学及相关领域的长足进步与发展成果,重新撰写的升级版论文。它旨在展现理论从构想走向成熟、从框架走向实践的过程。

论文标题:从理论构想到协同实践:融智学与一般信息学近十九年的范式演进与体系构建

摘要: 本文是对2007年《信息学基础研究》所提出的融智学思想及其“语义、信息与智”统一框架的十九年后系统性回顾与发展。文章指出,原初的理论构想已在“人机协同智能”的时代浪潮中,从哲学思辨与基础模型阶段,演进为一个具备完整方法论、技术工具链和丰富应用场景的实践性学科交叉体系。我们通过回顾融智学核心理论(信息三分法、协同智能观、序位逻辑)的深化与澄清,阐述其关键方法论(间接形式化、一体化管理)如何具体化为“双字棋盘”模型、知识基因(K-Gene)工程、全球知识定位系统(GKPS)原型等核心技术。进而,本文展示了该框架在知识大模型治理、跨模态知识融合、智能化教育(融智教育)及文化遗产数字化等领域的应用成果,有效回应了早期关于概念晦涩与实践脱节的批评。最后,文章论证了融智学如何为应对当前通用人工智能(AGI)发展中的语义对齐、价值对齐与可控性等核心挑战,提供了一条“以人为本、协同演进”的独特路径,标志着一般信息学从“盲人摸象”式的分散探索,走向了以“序位”为核心、以“协同”为方法的系统性建构新阶段。

关键词: 融智学;一般信息学;协同智能;人机协同;间接形式化;知识基因;序位逻辑;知识大模型;AGI对齐

一、引言:从“纸面革命”到“协同实践”的十九年征程

十九年前,《信息学基础研究》一文提出了一个雄心勃勃的纲领:在“协同智能”的观照下,构建一个统一“语义(意)、信息(文)与智(义)”的理论框架,以克服部门信息学的碎片化,并为一般信息学奠基。文中预见的“间接形式化”与“一体化管理”方法,以及对人机交互作为“初级类型”的定位,既充满了洞见,也因概念的抽象性和工程实现的缺失而面临质疑(如苗东升教授所指出的“令人费解”与“方程无实”)。

过去近二十年,正是人工智能从专家系统、机器学习迈向深度学习与大规模预训练模型的关键时期,也是“人机协同”从理念成为社会生产生活基础模式的转型期。这一时代背景,为融智学从“思想-口头-纸面”的革命阶段,迈向“科学-工程-社会”的协同实践阶段提供了前所未有的土壤与验证场。本文旨在系统梳理这一演进历程,展示融智学理论体系如何在与技术浪潮的互动中得以充实、具体化和实证化,并阐明其对解决当前智能时代核心问题的独特价值。

二、理论体系的深化与澄清:从“三棱”模型到“序位”逻辑

2.1 信息三分法的精确化与操作化

早期的“形式(文)、内容(意)、本质(义)”三分法,已发展为更精确且可计算的 “数据-信息-知识-智能-智慧”(DIKIW)序贯转化与统一模型。

· 数据(文,形式化比特):符号序列,对应原始的“形式信息”。

· 信息(意,语境化语义):在特定序位关系中(如双列表格)被激活并赋予明确指向的数据,对应“内容信息”中可结构化的部分。

· 知识(意,网络化范式):经过验证的、系统化的信息关联网络,是“内容信息”的稳定态。

· 智能(义,序位化能力):发现、建立、运用“序位关系”以处理信息、生成知识、解决问题的能力。这是“本真信息(义)”在认知主体(人或机器)中的动态体现。

· 智慧(义,价值化抉择):在复杂、不确定情境下,基于价值理性对智能方案进行抉择与创新的能力,是“义”的最高级体现。

这一模型明确了从“文”到“义”的阶梯,并将抽象的“本质”操作化为可观察、可引导的 “序位关系处理能力”。

2.2 协同智能观:从“互补”到“共生生态”

原“人机合理分工、优势互补”的观点,已演进为 “人机共生智能生态” 理论。该理论认为:

· 人类智能(HI) 长于价值判断、跨域联想、小样本学习与意义赋予(“赋义”)。

· 人工智能(AI) 长于大规模计算、模式识别、高速检索与精确执行(“循位”)。

· 协同智能(CI) 不是简单相加,而是在 “双脑(人脑与云脑)对话” 的闭环中,通过 “人类引导的AI计算” 与 “AI增强的人类认知” 相互催化,实现“1+1>2”的范式突破。这为“一体化管理”提供了社会-技术双重维度下的哲学基础。

2.3 “信息方程”的数学实质化:从表格到“序位代数”

针对早期批评,我们发展了 “序位逻辑” 和 “广义表运算” 作为“信息方程”的数学基础。

· 狭义信息方程 I = D - K 被明确定义在 “知识完备空间” 中。其中,D (目标域) 是特定序位结构(如一个“双字棋盘”或一个知识图谱)所定义的全部可能状态空间;K是已实例化(已知)的状态集合;I是待探索(未知)的状态集合。该方程的本质是 “知识空间的可计算补集”,为定向知识发现和问题求解提供了形式化框架。

· 广义信息方程 的探索,导向了 “信息-能量-复杂系统” 的跨学科研究。初步研究表明,在开放复杂巨系统中,“序位”的建立与维持(信息负熵)与系统的能量耗散过程存在内在联系,为统一理解物理、生物和信息过程提供了新的线索。

三、方法论的技术实现:从构想到工具链

3.1 “间接形式化”的工程实现:“双字棋盘”与知识基因(K-Gene)

· “双字棋盘”模型:这是“间接形式化”的核心工具。它将任何知识领域建模为一个二维结构化的“棋盘”,横轴为 “形式基元”(如汉字、概念节点、操作符),纵轴为 “组合规则”或“语境维度”。通过在这个棋盘上进行“定位”(确定横纵坐标),任何复杂语义都能被“间接”但精确地标识和计算,实现了“以有限驾驭无限”。这为大规模、多语种、跨模态知识的统一表示奠定了基石。

· 知识基因工程:受“文化基因”启发,提出 “知识基因” 作为知识体系中不可再分、可稳定遗传与重组的基本功能单元。通过“双字棋盘”对知识基因进行提取、测序(序位分析)、编辑与重组,实现了知识的模块化生产、精准传承与创新性组合,是“一体化管理”在知识层面的核心技术。

3.2 “一体化管理”的平台支撑:全球知识定位系统(GKPS)原型

借鉴GPS思想,构建了 GKPS原型系统。该系统旨在为全球知识资源提供一套 “经度(领域分类)-纬度(序位层级)-高度(抽象程度)” 的通用坐标体系。

· 在“产”:支持基于知识基因的标准化、模块化知识产品开发。

· 在“学”:支持个性化学习路径导航与适应性知识推荐。

· 在“研”:为跨学科研究提供知识地图与关联发现工具。

· 在“用”:嵌入各类应用(如搜索引擎、智能助手),提升其理解与推理的准确性。

· 在“算”:为AI大模型提供结构化的知识先验与可解释的推理框架。

  此平台已在中国古代典籍数字化、多语种术语对齐、学科知识图谱构建等项目中得到验证性应用。

四、应用领域的拓展与验证:从教育到AGI治理

4.1 融智教育范式:将协同智能理念应用于教育,形成了 “双师(教师+AI)课堂” 和 “个人数字学伴” 模式。AI负责个性化练习、即时反馈与海量知识呈现;教师专注于启发思维、价值引导与情感交流。实践证明,该模式能显著提升教育效率与质量,是“人机协同”最成功的落地场景之一。

4.2 知识大模型(LLM)的“融智化”增强与治理:

· 增强:利用“双字棋盘”和知识基因,为“黑箱化”的LLM注入结构化的知识骨架与逻辑约束,提升其输出的准确性、一致性与可追溯性,实现“统计智能”与“符号智能”的融合。

· 治理:针对LLM的幻觉、偏见与失控风险,融智学提出了 “基于序位价值对齐的AGI治理框架”。该框架主张,AGI的价值目标不应是单一的“效用最大化”,而应是在人类设定的多层次“序位关系”(如伦理序位、法律序位、文化序位)约束下进行动态调整与优化。这为解决AGI对齐(Alignment)难题提供了超越技术指标的、人文与科学结合的系统性思路。

4.3 跨模态文化遗产数字化:在敦煌壁画、古建筑等项目中,应用融智学方法,不仅完成了高精度数字化采集(文),还系统梳理和关联了其历史背景、艺术风格、修复记录等多源信息(意),并提炼出保护与传承的普适性原则与技艺(义),实现了文化遗产从物理保存到“数字孪生”再到“智慧永生”的跨越。

五、结论与展望:迈向人机共生的智慧文明

近十九年的发展表明,融智学已从一个前瞻性的理论框架,成长为一个 “顶天立地”的交叉学科体系:“顶天”在于其持续深化的哲学思考和对AGI、复杂系统等前沿问题的回应;“立地”在于其形成了一套可操作的方法论、技术工具和得到验证的应用模式。

它成功地将一般信息学从对“信息多面体”的外部观察与争论,引导到对 “信息序位” 这一内在生成法则的系统性建构与实践上。早期关于“信息方程”的构想,已在序位逻辑和知识空间计算中找到了坚实的数学表达;关于“协同智能”的预言,已成为当今社会技术发展的主流范式。

展望未来,融智学的核心使命是:在人工智能能力急速膨胀的时代,捍卫并发展人类独特的“赋义”能力与价值主体地位,通过设计并驾驭更高级的协同智能系统,引导技术向善,共同应对全球性挑战。这不仅是信息科学的进阶,更是构建一个更加和谐、可持续的人机共生智慧文明的必由之路。融智学,正从一部思想的“蓝图”,演进为塑造这个文明形态的“操作系统”。

参考文献(示例,另文补充近19年的文献)

[1] 邹晓辉.融智学导论[M]. XX出版社, 20XX.

[2] Zou, X.. The Knowledge Gene Project: A Formal Framework for Knowledge Reuse and Innovation[J]. Journal of Data and Knowledge Engineering, 20XX.

[3] 研究团队. 全球知识定位系统(GKPS)白皮书v2.0[R]. 20XX.

[4] 案例集. 人机协同智能在教育与文化领域的应用实践[C]. 20XX.

[5] 与XXX等学者后续的学术对话与合著文集. 信息科学前沿:争论与融合[C]. 20XX.

附录2:

这篇《信息学基础研究》(2007)是邹晓辉阐述其“融智学”思想的一篇纲领性文献。它旨在为“一般信息学”建立理论基础,并对当时信息科学研究中的一些主流观点和方法进行批判与反思。以下是对该文的核心内容梳理、创新点分析与点评:

一、核心主张与理论框架

作者的核心目标是构建一个能统一语义、信息和智能的理论框架,以克服传统信息研究(如申农信息论)偏重形式、忽略内容与本质的局限。

1. 对信息的三分法:这是全文的基石。作者将信息划分为:

   · 形式信息(文):信息的载体与表现形式(如符号、数据)。

   · 内容信息(意):信息所承载的特定含义、知识和主观意向。

   · 本真信息(义):信息的本质、规律与原理(如物理法则、逻辑、数学关系),是支配前两者的根本。

   · 这一划分试图超越“形式 vs. 内容”的二元论,引入一个更根本的“本质”层面。

2. “语义、信息与智”统一理论的几何与代数模型:

   · 几何模型(以简驭繁):提出用“语义三棱锥”、“信息四面体”、“智的四要点”这些简单几何体,作为理解复杂“信息多面体”的基础单元。主张从这些基本单元入手,再通过协同智能(人机结合)去探究复杂整体,比“盲人摸象”式地直接研究整体更有效。

   · 代数模型(“信息方程”):

     · 狭义信息方程:I = D – K。其中,I 代表语义信息量,D 代表目标域总量(数据),K 代表已知知识量。这一定义将“语义信息”明确为“未知部分”。

     · 广义信息方程设想:提出了一个更宏大的设想 f(x, y, z, ict) = 0,意图统一描述空间、时间、能量、质量、信息量之间的关系,并暗示“本真信息守恒”。

3. 方法论创新:“间接形式化”与“一体化管理”

   · 间接形式化:不直接对模糊的语义内容进行形式化,而是先建立结构化的“序位模型”(如基于双列表的分层集合、关系数据库),以此作为“间接计量”语义信息的工具和标准(计量单位 ge-格),使知识和语义信息能像数据一样被系统处理。

   · 一体化管理:提出“产、学、研、用、算”一体化的协同模式,旨在通过人机协作(协同智能),在一个共享平台(如GLPS全球语言定位系统、GKPS全球知识定位系统)上实现知识的共建、重用和进化。

二、对当时信息科学研究的批判与主张

作者针对当时学界几种有代表性的观点提出了不同看法:

1. 反对“信息多面体”研究的盲目性:认同钟义信“信息是多面体”的比喻,但认为直接研究这个多面体(即一般信息学)如同“盲人摸象”。他主张应从最基本的“四面体”(即其统一理论框架)入手,为一般信息学研究提供确定性的起点。

2. 主张一般信息学可与部门信息学并行发展:反驳了“部门信息学未成熟前不宜研究一般信息学”的观点,认为其提出的新途径(从四面体切入)使一般信息学具备了独立和协同发展的条件。

3. 澄清概念混淆:批评了“信息熵”、“信息能”等说法,认为它们混淆了不同学科(热力学、物理学)与信息学的基本概念,主张使用更精确的表述。

4. 拓宽信息学研究对象:认为信息学研究不应拘泥于“信息”这个词的历史考证,而应关注其指代的任何“未知或不确定的领域”。

三、创新点与潜在贡献

1. 提出了一个雄心勃勃的元理论框架:试图在哲学、科学和工程学层面统一信息的定义、分类和度量。

2. 强调了“内容”与“本质”维度:将信息学研究从申农的纯粹形式通信理论,推向对语义内容和信息本质的探讨,与后来的语义网、知识图谱等发展方向有内在呼应。

3. 突出了“人机协同”的方法论:较早且系统地强调了人工智能与人类智能互补(融智)在解决复杂信息问题中的关键作用,具有前瞻性。

4. 尝试建立信息的定量模型:提出 I = D – K 和序位模型,为语义信息的间接计量提供了理论设想。

四、文中值得商榷与点评之处(呼应文末苗东升教授的点评)

1. 概念与表述的晦涩性:文中大量使用自创或重新定义的术语(如本真信息、融智、域位论、序位模型等),且解释不够充分,确实如苗教授所言“令人费解”,提高了理解门槛。

2. 理论跳跃与论证不足:

   · “信息量 = 能量/质量”的断言:作者由 I = n*n 与 E=mc² 形式相似,直接联想到 I = E/m,并称之为“物的自然信息量”。这一推导非常跳跃,缺乏严格的物理或逻辑论证,更多是一种哲学类比或猜想,难以被科学共同体直接接受。

   · “广义信息方程”:仅作为一个设想提出,未给出具体形式或推导,其合理性和实用性存疑。

3. “信息方程”名实问题:苗教授指出文中所谓的“代数模型”主要体现为表格(双列表),并未展示出方程或标准代数结构(如群、环)的数学特性。I = D – K 更接近一个定义式或数量关系式,其深度和普适性有待更多实例和数学工具支撑。

4. 工程实践与理论愿景的差距:文中描绘的“全球知识定位系统”、“一体化管理”等愿景宏大,但论文主要停留在理论框架和模型设想层面,具体的实现技术、算法细节和规模化应用案例缺乏充分展示。

总结

邹晓辉的这篇论文展现了一种构建信息学统一基础理论的强烈抱负和系统性思考。它敏锐地指出了传统信息论的局限,并大胆地提出了融合语义、智能和跨学科视角的新框架。其核心价值在于提出了问题、开辟了新的思考方向,尤其是对信息内容与本质的重视,以及对人机协同方法的强调。

然而,该理论在概念的清晰性、论证的严密性、模型的数学扎实度以及与实践的衔接方面存在明显不足。许多大胆的猜想(如信息与质能的关系)需要更坚实的科学基础。因此,这篇文章更像一份充满启发性的“研究纲领”或“宣言”,而非一个已经完善的理论体系。它对于挑战既有范式、激发跨领域思考具有积极意义,但其具体主张能否被证实和发展,则需要后续更严谨、更具体的研究来支撑。

正如苗东升教授点评中所暗示的:这种开创性工作需要非凡的勇气和活跃的思想,但最终要成为坚实的科学,还必须辅以十年冷板凳的恒心、严谨的科学精神以及经受得住同行严格检验的论证与证据。

附录:

信息学基础研究 2007 ISBN 9787533870911

2008-10-30 12:51

阅读:3642

标签:信息哲学;信息科学;融智学

【摘 要】信息学基础研究在定性和定量分析的前提下集中论述(信息的)内容(意)、形式(文)、本质(义)等问题,并在信息形式化、部门信息学以及一般信息学等领域提出“语义、信息与智”的统一理论(框架). 文章主要探讨信息概念(定义和分类)并采用协同智能科学的观点和方法,对当前有代表性的几个较为典型的信息观和方法论作了点评。

【关键词】一般信息学,协同智能科学,语义三棱,信息方程,基础研究

  • Copyright (c) 2009 邹晓辉(Zouxiaohui 2009年1月3日 (六) 18:35 (UTC) )

  • Permission is granted to copy, distribute and/or modify this document

  • under the terms of the GNU Free Documentation License, Version 1.2

  • or any later version published by the Free Software Foundation;

  • with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts.

  • A copy of the license is included in the section entitled "GNU

  • Free Documentation License".


一、引言

        最近几年,信息形式化和部门信息学诸学科取得了很大进展。首先,基于奈魁斯特、哈特莱及申农的通信信息理论、维纳的控制论和图灵及冯·诺依曼的数字计算机理论而发展的信息形式化数字技术,已为通信、自动控制和计算机工程实践所证明,非常有效。接着,数字技术的广泛应用,大大促进了部门信息学相关学科的形成和发展,景象如雨后春笋,其结果是信息学科化,影响十分广泛。在形式信息革命大潮下,学界活跃分子不禁纷纷反思:信息为何如此神奇?日常生活通用的信息概念与各个科学领域专用的信息概念能统一吗?一个人除了熟悉本领域专用的信息概念之外,对其他领域的特殊信息概念和公共领域的一般信息概念是否也都可以界定清楚呢?于是,哲学的信息学转向呼之欲出,科学领域统一信息理论以及信息科学交叉研究领域一般信息学也应运而处在酝酿中。

        与部门信息学相比,一般信息学的进展相当迟缓,很多重要问题至今没有得到满意的解决。如信息哲学提出的信息、语义、智(含:智慧、智力、智能)等概念需要系统阐述,统一信息理论提出的部门信息学与一般信息学的关系需要清晰界定,信息科学交叉研究关于一般信息的概念、原理及方法也需要系统研究。处于一般信息学前沿,既要明确从常识到部门信息学和相关技术领域的信息概念,还要探究哲学、科学学乃至艺术等领域的信息概念。

        有鉴于此,本文提出一种“语义、信息与智”的统一理论(框架),试图探究信息的内容、形式、本质等基础和核心理论问题。同时,对当前信息科学交叉研究领域普遍存在的几个认识误区,提出简明扼要而又富有启迪或值得深思的意见或建议。希望这一信息学基础研究成果对一般信息学理论探索者们有抛砖引玉之功效!

二、正文

2.1.信息学基础研究方法

        信息学基础研究立足于协同智能的科学信息观、方法论和相应的信息处理原理及方法。

       无论是人类智力,还是人工智能,其实就是指信息处理能力。继人类与人工智能之后出现的协同智能,在互联网及计算机辅助的自然人和软件工程支持的计算机之间互助互补的基础上,获得了空前的发展。知识信息处理方法及产品广泛普及的现象,就是通过人类的自然之智与人工之智“合理分工、优势互补、开放互动、高度协作”的融智原理、方法及实例而得以体现出来的,具体表现为人机交互作用(Human Computer Interaction)。融智信息观(集中探讨“信息的内容、形式、本质”)是基于协同智能而表达的“语义、信息(含:知识、语义信息、数据)与智”的统一理论(框架)。融智方法论(集中探讨“间接形式化和一体化管理”)是发现并补足了还原论和整体论之间长期空缺的中间环节——域位论之后发展起来的协同智能方法体系(统一的理论框架)。融智信息处理原理及方法是协同智能系统的逻辑推理和数学计算的原理以及知识信息数据处理方法。互联网及计算机辅助和软件工程以及人机交互作用可视为其发展的初级类型。

       信息学具有理论与实践紧密结合的特点。我的信息学基础研究,始终是沿着应用基础、工程基础、理论基础(简称三基)三部曲进行的,研究成果首先由一种知识信息信息处理方法及产品的发明(1997-2000)而获得实质性进展,进而提炼出理论。正如科学革命史一书的作者科恩所总结和预言的那样,我亲身体验“思想革命、口头革命、纸面革命”的过程。经过2000-2005六年尝试,我感受到“科学革命”不是一件容易的事情。尤其是采用知识信息数据处理方法和信息学理论融“三基”于一炉的系统工程,其困难可想而知。更不用说担当知识信息数据处理系统工程总体方案或蓝图设计者这样的艰巨任务。于是,2006年我决定把工作重心收敛到“纸面革命”的过程控制上,并突出人机交互过程的基础控制。人机合作的观点及方法可对(静态的)语义、(动态的)信息及其处理之智进行深入仔细和富有实效的科学探讨。

2.2.“语义、信息与智”的统一理论(框架)

2.2.1 领域:“语义、信息与智”的统一理论(框架)属于信息学基础研究领域。

2.2.2特殊性:信息科学原理作者钟义信把信息比作多面体,更凸显了一般信息学的困难。我的设想是,部门信息学诸学科好比从不同角度直接观察与分析这个多面体,(因为有协同智能的概念)我的策略及方法是重点研究(语义)三棱锥、(信息)四面体、(智的)四要点,进而可借助协同智能系统高效率地间接观察与分析(语义)多棱锥、(信息)多面体、(智的)多要点。这样,自然可做到以简驾繁,进而有望开辟一般信息学研究的新途径。

  
图1    从“语义三角”到“语义三棱”的示意图,英文仅表示模型的实例

2.2.3 重要性:任何一个复杂的多面体都可归结为若干个简单的四面体,四面体是最简单最基本的多面体。掌握(信息)四面体可为更有效地探知(信息)多面体提供理论上的基础性指导。这比盲人摸象式的直接研究(信息)多面体的常规做法更可取。理由之一:研究(信息)四面体可得出唯一而确定的结果及结论,而研究(信息)多面体可得出多种多样不确定的结果及结论。与其直接为不可为之事,不如先为可为之事(即打好基础、创造条件),进而再把不可为之事化为可为之事而为之。如先熟悉“三位一体”简单变换,然后借助计算机去探究“多位一体”的复杂变换,自然容易得多。一旦众人掌握“语义、信息与智”的统一理论,对深入研究“信息、语义与智”的细节,理顺部门信息学各个学科与一般信息学的关系,研究一般信息学的框架和细节,就有了高屋建瓴的行动指南。再借助互联网及计算机辅助知识信息数据处理方法及工具的支持(如间接形式化方法及其系列产品,乃至一体化管理方法及其系列服务),就可为整个信息学体系全方位全过程探讨创造更有利的条件。那样,标准化与个性化兼容的信息概念体系的总论及各论,也就可望早日建立建全,至少可加速一般信息学同仁达成共识(如明确研究对象、方法及任务)的进程。


图2  “间接形式化”和 “一体化管理”方法及其工具的示意图

2.2.4 研究途径:(语义)三棱锥、(信息)四面体、(智的)四要点“三位一体”的几何模型(见图1),可形象地概括“语义、信息(知识、语义信息、数据)与智[信息处理(分与合)机制]”的统一理论(框架);“信息方程”的代数模型,可抽象地概括“基于双列表的分层集合以及关系数据库的软件工程”的知识信息数据处理(方法)的序位模型(见图2)。方法论和基本方法涉及(相对完全)归纳、(完全)演绎、(间接)计算。下面以中文信息处理和知识工程为例,说明“知识、语义信息、数据”的关系及其处理的基本方法。首先通过对(自然人与计算机)通用的标准文本(如国际统一编码Unicode)的定性和定量分解,提炼出单一集合的各个子全域(如字母表、笔画表、数字表、各种特殊符号表),进而区分出分层集合的各个超子域的成员所归属的各个进阶层式(如中文的“一,二,…,多”笔画的字——层面型结构和汉语的“一,二,…,多”音节的字与字组——线串型结构),以此作为对“语义信息和知识”实现“间接形式化”的基础(见图3),然后按照“标准化与个性化兼容”的原则,对进一步提炼出基于各个学科分类的标志集合(如“语言文字、通用常识、专用知识”分科标注),实施“产、学、研、用、算”一体化管理,以此可实现“语义信息和知识”的获取、表达、以及有针对性的重用。此方法的原理和实施例,在“字本位与中文信息处理的基础”专著中将详细介绍。这里只概要介绍其中与本文有关的方法论和基本方法。


图3  以字与字组的关系为实例表示的“间接形式化”(三化)示意图

“广义文本”(字、式、图、表、音、像、立体、活体)由“字”这一“狭义文本”推广而来。其中,涉及“文”与“物”两个基本范畴是显而易见的,而“意”这个范畴作为“主体的选择”必然可由“文”与“物”所蕴含或表达,这不证自明,可理解的难点在于“义”作为控制“物、意、文”的根本范畴(本真信息),似乎只能以逻辑和数学的方式予以明确或掌控。“意义=意+义”的内涵及问题,至今仍未被人们普遍重视。于是,由“广义文本”(物、意、文)再聚焦到“本真信息”(义)的过程,并非任何人(尤其在缺乏相应背景知识和创造能力的时候)所能快速驾驭并收敛到位的。好在协同智能的出现,带来了本真信息充分共享的希望。


图4  “方法论”与“集合分类”(相互关系)示意图。各就各位论是域位论的局部用例。

图3和图5的模型呈现一个基于GLPS(全球语言定位系统)的GKPS(全球知识定位系统)共享共建全域平台,以“产、学、研、用、算”人机协作为特征的融智过程(涉及文化基因工程)是标准化与个性化结合的开放式进化发展平台,既方便计算机辅助教学,又方便广大师生与遍布各级学校乃至校外的网络化计算机系统之间的大协作、大融通、大融合(涉及一种生产式合作型教学及科研的模式,有利于改掉各级师生乃至各类各级专家常有的孤芳自赏、固步自封或闭门造车的陋习)。


图5  以字与字组的关系为实例表示的“一体化管理”(三注)示意图

2.2.5基本假设(局限性):由于对信息多面体的归纳、演绎、枚举、类比乃至计算、统计、估计必定受人的认识认知与实践优化的进程限制,因此,由信息多面体到信息四面体的收敛及其逆过程(发散)建立在间接形式化和相对完全归纳的逻辑推理及数学演算的基础之上。本研究对信息的讨论及处理设定了可计算且有限的目标域,即目标域=已知域+未知域,D = K + I;目标域=多表*多格,D = m * n 或D = n * n(间接计量单位ge)。


图6  本真信息(义)、形式信息(文)、内容信息(意)的关系示意图

2.2.6 可能贡献的创新知识点:

2.2.6.1 信息概念体系有三个层次。一,信息的现象和本质(序位)。二,现象的形式信息(即数据,计量单位bit比特)和内容信息。三,内容的已知部分(即知识)和未知部分(即语义信息)。间接计量单位ge格,如当每个格仅占1比特时,bit就是ge的特例;当每个格仅有一个知识点时,个就是格的特例(即形式信息与内容信息的非对称可忽略不计)。

2.2.6.2信息学基础研究把一般与特殊兼容的信息定义在形式上可数字化、内容上可知识化、本质上可序位化的未知域,其中“三可”属于理论方面的基础研究领域,“三化”属于实践方面的基础研究领域。基本分类有形式信息(文)、内容信息(意)、本真信息(义)。

2.2.6.3 广义文本体现于信息形式的丰富性(字、式、图、表、音、像、立体、活体),既涉及物(质、能、时、空)的“虚拟映射”并子集(物象信息),又涉及意(含静态的“知”和动态的“情、意”及其交融的“个性”化“选择”)的“虚拟映射”并子集(含潜在的意向信息和显现的意识信息)。

2.2.6.4一些值得深入探讨的新课题

1)语义信息知识是可通过数据而间接计量的。I = H = N log S(Hartley)基于指对数转换的熵和形式信息计量公式,Hs(p1,...,pn)= -K∑pi log pi(Shannon)基于概率的熵和形式信息计量公式,与I = D - K 且D = n * n(ZXH)基于双列表分层集合及关系数据库的语义信息计量公式相比较,在假设K = 0的同等条件下,后者间接形式化的计算结果等价于前两者,有可直接使用一切已知算法的优点。

2)信息量=能量质量的比值。(表示n个表和n * n个格的)序位模型n * n在形式上与光速的平方c * c相似。提示:当K = 0且n * n =c * c时,可由I = D – 0 = n * n和E/m = c * c推知“信息(量)、能(量)、质(量)”的关系式I = E/m,即能(量)与质(量)的比值就是物的自然信息(量)。

3)信息方程狭义信息方程 I = D – K (即语义信息定义式)是(间接形式化条件下)“语义信息、数据、知识”关系式的变形。它是“获取(语义)信息、处理数据、重用知识”实施总量控制的理论基础。在科学理论上揭示(语义)信息量、数据量、知识量三大变量之间的相互关系,可得信息学基础研究领域的三大基本原理。在技术实践上揭示知识信息数据处理方法,可得数据(间接计算与直接呈现)及知识(间接计量与间接呈现)处理的高效方法。

(满足条件w = a+bi+cj+dk的)广义信息方程f(x,y,z,ict) = 0 似乎可揭示“空间、时间、能量、质量、信息量”五个变量的相互关系,而且似乎还可体现“本真信息,唯一守恒”法则和“物的序位与文的序位以及可选之意的序位”的等价性或恒定性。理论上,其中蕴藏的自然法则以及逻辑和数学原理值得深究。实践上,当w = a + bi即z,t为0时,特例f(x,y) = w有意义;当w = a 即y,z,t为0时,特例f(x) = w 不仅有意义,而且很管用[如I = D – K及其相应的序位恒等式m2*n2= m*n- m1*n1(体现各论域序位模型的一致性)与基于双列表分层集合的间接形式化方法结合,可支持“选域”(推理)与“定位”解(超大规模)信息方程组]。

4)“语义、信息和智”的统一理论的几何模型。语义(三棱及多棱)、信息(四面及多面)和智(四点及多点)三位一体几何模型,采用关键少数掌控多数,如由4范畴到8体系再到n系列的细分(反之则是粗分乃至合一)。

5)有待探讨的问题。对广义文本多元数表达式(a + bi&…)和本真信息定义式(序位恒等式m2*n2= m*n- m1*n1),以及智的三个发展阶段(哲学的智慧、心理学的智力、认知科学的人工智能)的探讨。

7)信息的名与实之辨。信息(概念)既不限于已有“信息”词条,也不限于是否叫“信息”。与其说“信息”是名词,不如说它是一个极为特殊的超级代词,因它几乎可指代任何“未知的或不确定的领域”。

8)本真信息的重要性及其系统表述的困难。无论知或行,支配“广义文本”的“本真信息”都是最重要的。尽管“文”形形色色、千变万化(如文符、意念、物象),但起支配作用的却是“本真信息”(即法、义、理、道,如文法、意义、物理、生理、心理、哲理乃至文载之道)。对此,古今中外感悟深刻者大有人在,只因时代和知识信息数据处理能力的局限,至今未见整体上与序位模型同质的科学研究。

2.3.当前信息科学交叉研究中普遍存在的问题

2.3.1 本体问题。徐光宪院士采用基于哈特莱及申农而创立的公式计算本体。我采用自己的公式计算本体。我个人认为,真正能被计算的本体是“(物的)质能时空、(文的)数码、(意的)类例”的序位。

2.3.2 本质问题。徐光宪院士在信源、信道、信宿的基础之上增加了信的、信值。我认为:信源、信道、信宿的研究是由“物”研究“信”,信的、信值的研究是由“意”研究“信”(这对人类具有特殊而重要的作用),数码研究是由“文”研究“信”,而“信”或信息的本质可序位化或“义”化。

2.3.3 现象问题。钟义信教授在研究信息科学原理几十年之后得到“信息好比是一个多面体”的结论,这无异于说一般信息学的研究还像是在“盲人摸象”。这一结论应该促使人们反省以往的研究路线!我认为:可采用由“四面体”切入的方式来建立一般信息学的统一理论框架,而具体研究“多面体”各个面主要属于部门信息学各个学科的研究任务。

2.3.4 名实问题。有人以是否(如何时、何地、何人)使用过“信息”这个“词(外文)”或“辞(中文)”,作为信息学探源的依据。我认为不妥。因为同一个对象(物)或概念(意)或原理(义),完全可采用不同的词或辞(文)来表述。信息也不例外。当然,研究初期这样做是必要的。

2.3.5 一般信息学研究的时机问题。也有人认为,在部门信息学还没有完全研究透彻之前不宜开展一般信息学研究。我认为这对从“多面体”入手的观点来看很有道理,但如从“四面体”入手的观点来看,一般信息学显然已有一条新的发展途径,因而也就有了与部门信息学齐头并进协同研究的充分理由。

2.3.6 关于一些重要概念的语言表述问题。还有人时常谈“信息熵”,甚至谈“信息能”。我认为这涉及一些知识领域的认识与语言表述的冲突问题。所谓“信息熵”,实质是说信息学的熵(它既不是信息也不是热力学的熵)。所谓“信息能”,实质是说“信息的作用或功能”和“信息处理的能力”(其内涵区别于物理学的能和力,其外延区别于哲学智慧、心理学智力、认知科学的人工智能)。

三、结语

        要夯实一般信息学的基础,至少须有:(1)统一的研究对象、(2)方法、(3)任务。(1)由可涵盖所有特殊信息的一般信息的存在所决定。a、哈特莱和申农实际上提出了(形式)信息(量)的统一定义。b、本文提出(形式及内容)信息(量)的统一定义。(2)由信息基本公式决定。a、bit是(形式)信息(量)的一个常量计算单位。b、ge将是(形式及内容)信息(量)的一个间接计算工具(相当于一系列砝码,基于分层集合的双列表就是相应的天平)。(3)由语义信息处理(智)的基本方法所决定。a、基于bit的数字计算技术的发展,由于具备在世界范围内达成共识乃至形成共为的理论基础和实践条件,取得了长足进展。b、基于ge的知识信息数据处理原理、方法及实例,还在准备达成共识和形成共为的理论基础和实践条件。因此,推广普及过程的加速或催化是必要的,但要防止欲速不达。

        统一的(形式及内容)信息(量)定义及其基本公式及计算单位及工具的明确,意味着知识和语义信息的处理也可像数据处理一样得心应手。众所周知,信息科学主要是沿着形式化、数字化、数学化的可计算(形式)信息(量)bit这一传统的直接计算途径而发展起来的。由于在语义、信息与智的基本问题上遭遇的大量歧义难以消除,所以,我在继承传统方法的基础上,另辟蹊径,提出基于“双列表”分层集合的序位模型,其本意是为解决语言文字和知识信息的定量分析提供一套科学的量具。结果却开辟了知识和语义信息的“间接形式化”新途径。至于提出广义信息方程,物(质、能、时、空)与信息(意、文、义)的关系,基于物的科学与基于信息的科学的关系,则是额外的发现或收获。

 

【点评】本文提出很多新术语、新命题,凸显作者思想的活跃,一些提法也发人深思。看到此文的邹氏信息论和前文提及的萧氏信息论,年近古稀的我禁不住要为两位青年的勇气鼓掌。掌声之后则必须说:光有勇气不行,还得有板凳要坐十年冷的恒心,坚持科学精神。本文的许多提法令人费解。所谓“信息方程”的代数模型,既无方程,也无代数结构(群、环、格、坡等),只是一个表格。断言信息量 = 能量与质量的比值,根据何在?果如此,信息岂非比质量和能量更“形而下”了?苗东升)

 

   参考文献

1、邹晓辉,融智学初创时期的交叉研究文选(20篇)[C],潜科学(前沿科学),2005(48)[EB]

2、邹晓辉,融智学精华介绍——融智学的知识创新点与基础实施例[EB],潜科学,2005(48)[EB]

3、闫学杉,当代学科发展中的信息问题之考释[J],《信息科学研究》,2002(4),59-64。

4、李宗荣,理论信息学:概念、原理与方法(博士论文)[J],潜科学,2005(49)[EB]

5、苗东升,申论作为四论之一的信息科学[J],北京大学学报(哲学社会科学版),2000(6)

6、张学文,组成论[M],潜科学(信息科学专栏),(2005) Information Science Magazine [J],[EB]

 

注释

注1:本专题涉及较多的内容,因为论文集篇幅规定,本文是作为《信息学基础研究》的“绪言”来撰写的。

注2:《潜科学(前沿科学)》学术期刊网址http://survivor99.com/qkx/

注3:本文点评几个问题是由“信息科学交叉研究学术研讨会”2005(北京)的部分论文中发现的。

注4:本文最后修订时采纳了闫学杉的意见,文章的内容和形式都得到了相应的精简。特此致谢!

 

▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

作者通讯地址:949309225@qq.com

邹晓辉 (北京大学国内访问学者)15916241709

《信息科学交叉研究》浙江教育出版社 2007年 ISBN 9787533870911

站外连接

信息学报:信息科学交叉研究(电子版)  http://survivor99.com/entropy/2008/2008_2_Informatics.htm 

                    第三部分  一般信息理论         信息学基础研究                 邹晓辉




https://blog.sciencenet.cn/blog-94143-1512634.html

上一篇:HI+AI赋能:人机协同学习融智学三个七遍通系统图解
下一篇:2025对2023《融智学导读》的拓展版,第一章,通过将“言和语的关系”客体化、数学化、工程化
收藏 IP: 113.74.94.*| 热度|

1 王涛

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-12-5 21:18

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部