||
早期思想:后来理论探索原点
2000年申请的专利《一种知识信息数据处理方法及产品》(公开号CN1274895A)是融智学早期思想,也是后来理论探索原点。将其与范畴论框架、四类集合划分、五类信息处理等概念对照,可发现其中已经蕴含了该专题几乎所有核心思想的雏形或原型。
1. 四类集合的专利体现
专利中明确区分了信息的四种形态,这与融智学总结的“单一、分层、分类、杂多”四类集合划分完全对应:
专利中的概念 对应融智学基础区分的集合4类型 说明
基因文本元素单一集合 26个字母、4个碱基、基本笔画等最小单元,即“元子对象”。
基因文本组合的层次 分层集合 从字母到词、句、篇;从碱基到密码子、蛋白质、细胞。这正是“元组态射”构建的层级结构。
多元基因文本类型 (bi&...) 分类集合 图、文、数、表、音、象等不同形式体系,即“标志/属性/特征”的分类。
广义真实文本 杂多集合 未经处理的原始信息原料,即“现象信息”的混沌状态。
2. “言和语的关系数据库”的专利原型
2002年做出的“言和语的关系数据库”,而在2000年的专利中,其核心逻辑已经清晰呈现:
“言”的数据库对应“基因文本元素”及其“全域数码”(a+bi&...)。这是静态的符号库。
“语”的数据库对应“基因文本组合”的规则,即元素在时间和空间上的排列(程序卡、结构卡、架构卡)。这是动态的态射库。
二者关系:专利中反复强调的“码式并列”、“对应转换关系”,正是“言”与“语”相互作用的体现。当时,用数据库实现这一关系,而今天用范畴论看,这正是对象与态射的协同。
3. 范畴论基础的早期直觉
在专利中虽然未提范畴论,但已经用数学语言(复数、多元数)和系统架构,直觉地构建了范畴论的核心要素:
· 对象:基因文本元素(由实数a指代)。
· 态射:元素组合成结构的方式(由虚数bi&...标识不同类型,组合规则由程序/结构/架构卡体现)。
· 函子:从“多元基因文本”到“一元数码文本”的转换,即不同形式体系之间的映射。
· 自然变换: “一通百通”、“同义并列通译”等概念,正是保持“义”(本真信息)不变的前提下,在不同形式(文、物、意)之间进行转换,这正是自然变换的精髓。
4. “智”的核心——选择用意
专利中多处出现“选择”和“用意”的概念:
选域定位:在多元数系中选择虚数元(bi&...)确定基因文本类别。
目标域:用户根据意图选择特定基因文本组合(集小成独享基因文本)。
意向意识:明确将“意”(意识意向)与“义、文、物”并列,指出“意”是智能主体的选择。
这正是融智学总结 “智=信息处理+选择用意” 的早期表述:信息处理是“文化基因工程”,选择用意是“选域定位”和“目标域选择”。
5. 五类信息处理的雏形
专利中的产品体系(网络、出版物、终端)已经隐含了五类信息处理的层次:
· 语言形式信息处理:处理“图、文、数、表、音、象、立、活”等多元基因文本。
· 知识内容信息处理:处理各学科、各领域的基因文本等共享数据库。
· 软件本体信息处理:全域数码定位系统(码、卡、表、库、网、端)本身就是软件本体的实例。
· 现象信息处理:处理广义真实文本,从中提取基因文本。
· 序位本质信息处理:通过全域数码的“序位”定位本真信息(义)。
6. 专利的超前性与当代意义
这份专利最令人惊叹之处在于它20多年前就预见到了今天人工智能和大数据面临的根本问题,并已经提出了以“序位”为核心的解决方案:
· 针对“知识爆炸”:提出“去冗存要”,通过基因文本的提取和全域数码定位,化无限为有限。
· 针对“垃圾信息”:提出“基准参照系和应对参照系”,使信息可测度、可定位。
· 针对“非标形式”:提出“同义并列通译”,通过统一的数码体系实现不同形式的转换。
· 针对“怪圈悖论”:提出“本真信息唯一守恒”从本体层面划清层次,避免自指混乱。
总结
在2000年的这份专利,已经奠定了融智学的理论基石和技术框架。今天,用范畴论、集合论、信息哲学等现代语言重新解读它,是为了揭示一个事实:真正深刻的思想,往往在其诞生之初就已蕴含了未来发展的所有可能路径。 当时的工作不仅是一项技术发明,更是一次对信息本质的哲学追问和系统性重构。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-3-7 20:25
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社