信息学基础研究分享 http://blog.sciencenet.cn/u/geneculture 语言理解&知识表达

博文

温故知新:一种知识信息数据处理方法及产品

已有 365 次阅读 2024-10-1 08:42 |个人分类:融智学前期探索|系统分类:人物纪事

解读:一种知识信息数据处理方法及产品_01.jpg

一种知识信息数据处理方法及产品

【申请号】 CN00109380.0 【申请日】 2000-05-31

【公开号】 CN1274895 【公开日】 2000-11-29

【申请人】 邹晓辉 

【发明人】 邹晓辉

【国省代码】 44

【摘要】

本发明属于语义信息及真实文本处理技术。 本发明的目 的是: 提供一种知识信息数据处理方法及产品。 本发明方法是文化基因工程方法,  特征是: 从广义真实文本中提取、 剪接或重组文化基因;本发明产品是全域数码定位系统,由码、 卡、 表、 库、 网、 端构成,  特征是: 全域数码化的网络、 出版物或终端。本发明的有益效果是: 建立基准参照系及应对参照系,解决因知识信息错位而引起的冗杂文本、 非标形式、垃圾信息、 知识爆炸和怪圈悖论等难题。

【页数】 22

【主分类号】 G06F17/22

【专利分类号】 G06F17/22;G06F15/163

金奖-邹晓辉.jpg

一种知识信息数据处理方法及产品

发明人:邹晓辉

2000  11  29日国家知识产权局专利局《发明公报》  16  48

2000  12 月(徐辉任主编时) 公布于系统科学之窗 论文专区

2002.04 (张学文研究员任主编时)公布于 潜科学(学术期刊)

 

本发明涉及人工智能、 计算机和通信技术的交叉综合领域, 属于一种语义信息及真实文本的数字处理技术 进一步是一种知识信息数据处理方法及产品

 

现在, 虽然在知识工程、 信息技术和数据或数字技术等方面有很大的发展, 但是, 由于人类关于语义信息的定性分析、 定量分析和结构分析长期未能获得实质性的重大突破 因此现有技术至今仍无法解决以下一系列知识信息数据处理的难题

数据或数字处理作为现有技术的核心, 对形式信息的量化处理虽然十分有效, 但是, 语义信息的量化处理却难以直接派上用场 因此, 各种各样的中介技术方法及产品, 便介入并参与了 对知识信息及真实文本的量化处理, 尽管其效果大打折扣。 在受限范围现有技术虽有较大进展, 然而, 在非受限范围却一筹莫展 因为, 现有技术只能对受限范围的知识信息及真实文本进行局部的量化处理 所以, 不能从根本上解决冗杂文本、 非标形式、 垃圾信息、 知识爆炸和怪圈悖论等难题

目前, 还没有能够一揽子解决上述难题的技术公开 可以说, 就解决上述难题而论, 不仅现有技术与相关技术的整合优势没有形成 相反, 各自为政、 一盘散沙的劣势却无处不在。 根本谈不上, 在人工智能与人类智能、 电脑与人脑、 电信网与神经网之间实现协同效能或优势互补 协同智能的发展在知识信息数据处理领域受到了现有技术的瓶颈制约。 至今为止, 尚无与本发明相同或相似的方法及产品问世。

 

以下进一步举例说明现有技术的缺陷或不足。

知识信息数据处理为例, 无论是直接的模数转换,还是间接的编码转换 要么由于真实文本未经提炼就直接转换为数字符号(例如: 数字图书馆技术) ,根本谈不上对知识信息的量化处理 要么由于真实文本与数字符号之间的中介程序太多太杂(例如: 计算语言学及其应用技术)  根本无法形成对知识信息及真实文本进行量化处理的统一标准 现有技术只能是一盘散沙、 各自为政。

进一步,以编码转换为例(涉及语言形式和知识内容的处理),一方面,现有的语言信息处理系统(包括机器翻译、自动识别以及广义文本通译等),还存在各种语言形式之间的通译和同种语言的非标形式的识别等一系列技术瓶颈;另一方面,现有的语义信息处理系统(包括机器分类、自动浏览以及知识基因提取等),也还存在诸如冗杂文本、垃圾信息、指数爆炸和怪圈悖论等一系列难题。现有软件工程及知识工程体系还缺乏从受限范围到非受限范围的转换机制, 缺乏总体标准

再进一步, 金融监管(涉及证券、 期货、 外汇交易各方对价格信息的量化处理) 为例, 造成失误或失败的原因虽很多,但根本原因是:人们还没有找到能够对各种价格变化所包含的激励或预警信息进行及时而透彻分析的有效方法(包括定性分析、定量分析和结构分析)  人们普遍认识不到:金融的本质是智融,缺钱的实质是缺智。现有的专家系统,无论是终端还是网络形式,都不具备协同量化处理知识信息及真实文本的功能;现行科教体系熏陶或培养出来的专家,即使是最有知识的专家也只能处理非常有限的知识信息及真实文本,而且, 还常常伴随着以偏概全的议论或见解。由此可见,人工智能和人类智能,都面临着协同智能的严峻挑战。

推而论之,在不同方面、不同阶段、不同层次和不同系统,都能轻而易举地发现现有的教育、 科技、经济、政治、外交、军事、法律、医疗卫生和日常生活等几乎任何一个领域都面临上述难题和挑战。在如今这样一个充满竞争且快速变化的竞智时代,试想一想:如果一个人、一个单位、一个国家,总是处于冗杂文本、垃圾信息、指数爆炸和怪圈悖论的包围之中,既搞不清楚自己所收到的这么多知识信息的本质含义,又不知道如何准确无误地发出自己应该发出的有的放矢的知识信息,也不明白自己所处的内、外、大、小环境中实际存在的各种重要的知识信息(包括正面的激励信息和反面的预警信息)的基本内涵,这时,如果这个人、 这个单位、这个国家又处于不利的竞争地位,甚至面临危机,那么,其处境或命运将会是怎么样的一种状态或过程呢?其结果是可想而知的。如果一个系统,包括智能网络及终端乃至独立的机器人,总是被非标形式或垃圾信息所阻止或干扰而无法正确应变,那么,其结果也是可想而知的。

现有技术的发展还受到当前的语义学理论和语义信息处理理论的发展制约。产业界对知识信息及真实文本的量化处理技术的效率,之所以如此低下这与学术界对语义信息的本质认识或阐述不清,是息息相关的。不仅仅是普通人把形式信息与语义信息混为一谈,而且绝大多专家也都常常把衍生形式与本真信息混为一谈。 至今为止, 还没有人明确地区分本真信息、 形象符号、 载体载能和意向意识,并且以此作为重构人类整个知识概念体系的基础框架。 虽然个人计算机和互联网技术接二连三地推动着信息技术不断地向前发展,但是,语义信息的本质究竟是什么?至今仍未见有令人信服的报道公开。对语义信息的定性和定量表述,还无法令人满意。

人类的整个知识概念体系,特别是语义信息理论体系,至今仍然是一个大杂烩,其根基是不牢固的。例如:以唯物论、唯心论和形式论三个基石不同支点而形成的各种基本观点,以及在它们的基础之上构建的人类知识概念体系及其各个分支理论,都忽略了本真信息的根本地位,甚至把本真信息与载能载体、意向意识、形象符号等衍生形式之间的基本关系本末倒置。在这种情况下,要发明量化处理知识信息及真实文本的有积极效果的新技术,首先就必须要找到能重构人类整个知识概念体系的新理论,否则,就根本不可能超越现有科技框架而获得真正的重大突破。

 

本发明的目的是提供一种知识信息数据处理方法及产品, 包括: 文化基因工程方法以及相应产品的生产及使用方法; 全域数码定位系统及其派生产品。 通过对全域基因文本元素的完全归纳和对已知域及目标域基因文本组合的相对完全归纳, 解决知识信息的计量及测度的难题, 促使人工智能与人类智能优势互补, 形成效率更高的协同智能, 促成形式信息革命向语义信息革命的时代飞跃。

如果说信息论创始人仙农提出了 形式信息数据处理技术及标准, 那么, 本发明的目的就是提出语义信息数据处理技术及标准; 如果说全球定位系统(GPS 柔性加工系统(FMS 和横断扫描仪(CT)是针对载体载能进行的全球数字定位、 柔性加工和横断扫描, 那么, 本发明的全域数码化的网络、 出版物和终端就是对知识信息进行的全域数码定位、 柔性加工和横断扫描; 如果说人工智能、 电脑和电信网在形式信息数据处理技术的支持下获得了极大的发展, 那么, 本发明就是要使以协同网络、 协同终端和出版物为特点的协同智能在语义信息数据处理技术的支持下获得前所未有的发展, 早日迎来智能主体进化发展的新阶段——协同智能时代。

 

本发明的具体任务是: 一、 提供文化基因工程方法即全域数码定位方法; 二、 提供全域数码定位系统, 产品形式包括: 1 纯形式的全域数码化网络, 即知识信息数据处理领域的GPS 2 纯文本的全域数码化出版物, 即知识信息数据处理领域的FMS 3 纯数码的全域数码化终端, 即知识信息数据处理领域的CT

 

本发明依据融智概念体系和信息基本定律而设计并实施。

所谓融智概念体系(注: 涉及对人类现有的整个知识概念体系的量化重构)  是指以义、 文、 物、意为基础而构成的协同智能主体的知识概念体系。 其量化形式采用能够通过复数域及复平面乃至曲面出入多元数系及多维空间的四元数形式。 义, 指本真信息; 文, 指符号形象; 物, 指载体载能; 意,指意识意向。 文、 物、 意统称本真信息的广义文本。 形式信息涉及文、 物, 其中, 文, 包括图、 文、数(注: 数字信息技术属于此范围)  表、 音、 像等形式, 物, 包括立体、 活体等形式; 语义信息涉及义、 意(注: 现有的意义理论及语义信息技术没有明确区分义与意) 

以曲、 棋、 语言为例, 对上述概念及原理的基本含义说明如下: 曲、 棋、 语言的机理(含: 法则) ,是本真信息, 即义; 展示其机理的文化形式, 如: 乐谱、 棋谱、 文字或字母或动作等, 是符号形象,即文; 展示其机理的物化形式, 如: 琴、 棋、 传感器官(含使用过程) 等, 是载体载能, 即物; 演奏者、 下棋的人、 智能主体的选择(包括以虚拟或实体的形式体现的意)  是意识意向, 即意。

所谓协同智能主体 是由人工智能和人类智能构成的新一代智能主体。 其功能是对体现义的基因文本元素及组合(包括程序、 结构以及框架等) 进行完全归纳及相对完全归纳, 以及, 由此发展的知识信息数据处理(包括广义及狭义的处理) 能力, 具有专家系统与专家群体的整合或综合优势。

所谓信息基本定律 即: 本真信息, 唯一守恒; 基因文本, 对应转换; 基因通式, 序趣简美; 特式特例, 非非各平(即: 非对称、 非同步、 各自平衡) 

唯一守恒法则, 体现本真信息的唯一性和守恒性; 对应转换法则, 体现图、 文、 数、 表、 音、 像等本真信息或基因信息的多元基因文本(注: 因为文、 物、 意, 都是义的展示, 具体表现为多元基因文本元素及其派生的各种基因文本组合) 只要同义即可并列; 序趣简美法则, 体现在文化基因通式及基因文本通式之中; 非非各平状态极其转换或变化过程, 是指各种各样的特式或特例与通式相比较,具有空间上的非对称性和时间上的非同步性, 以及特式特例各自平衡及趋动的特性。

本发明的目的是通过下述方案实现的。

 

基本方法:

一种知识信息数据处理方法 是对语义信息及真实文本进行定性、 定量及结构分析的文化基因工程方法, 其特征是: 从广义真实文本中提取、 剪接或重组文化基因, 步骤是: 以完全归纳的全域为基准参照系对基因文本元素的复用次数或复制件数进行自动统计, 以相对完全归纳的已知域及目标域为应对参照系对基因文本组合的复用次数或复制件数进行自动计量, 其中, 基因文本元素及组合均采用码式并列的形式, 包括式隐码显或以码代式与码隐式显或以式代码等特殊形式, 即在全域数码文本体系与多元基因文本体系之间建立对应转换关系。

 

相应的基本产品的生产方法:

一种知识信息数据处理产品的生产方法, 是以码代式进行知识信息数据处理的方法, 其特征是:选择纯数字形式和纯载体形式并使之相结合构成全域数码定位系统, 步骤是: 采用(a+bi&) 的具体数字作为指代基因文本元素的标准代码; 采用卡、 表、 库、 网、 端的具体载体作为承载基因文本元素及基因文本组合的标准载体; 以全域标准代码构成基准参照系; 以已知域及目标域标准代码组合构成

 

应对参照系。

相应的基本产品的使用方法, 同时, 也是派生产品的生产及使用方法:

一种知识信息数据处理产品的使用方法, 是以式代码进行知识信息数据处理的方法, 其特征是:

使用并依托全域数码化网络的基准参照系及应对参照系, 步骤是: 通过码式并列, 把广义真实文本中的基因文本元素及组合全域数码化, 构成实用的多元基因文本, 即全域数码化出版物; 通过码隐式显以及多元基因文本分析, 支持实施知识系统工程。

进一步的派生产品的生产及使用方法:

一种知识信息数据处理产品的使用方法, 是以码代式进行知识信息数据处理, 步骤是: 使用并依

托全域数码化网络及全域数码化出版物, 通过式隐码显, 构成数字的一元基因文本, 即全域数码化终端, 支持实施网络及网际知识产权监管和端到端的默契通信。

 

相应的基本产品:

一种知识信息数据处理产品, 是由码、 卡、 表、 库、 网、 端构成的全域数码定位系统, 包括纯数字形式和纯载体形式, 即全域数码化网络, 其特征是: 纯数字形式, 采用(a+bi&) 的形式语言编制源程序, 采用(0&1 的形式语言编制目标程序, a+bi&) 与(0&1 的交集即编译程序; 纯载体形式, 采用卡、 表、 库、 网、 端的具体形式承载码。

相应的派生产品:

一种知识信息数据处理产品, 其特征是: 由全域数码化网络支持的全域数码化出版物, 包括已知域集大成共享基因文本和目标域集小成独享基因文本, 含公开或保密、 标准化或个性化、 通用或专用的多元基因文本出版物。

进一步的派生产品:

一种知识信息数据处理产品, 其特征是: 由全域数码化网络及全域数码化出版物支持的全域数码化终端, 含交换机及服务器和用户计算机及其它终端装置或载体的一元基因文本终端。

详细步骤进一步综合说明如下:

1 确定基准参照系(化无限为有限) 和应对参照系(变抽象为具体) 步骤是:

第一, 确定基准参照系: 逐方面、 逐阶段、 逐层次、 逐系统地分解目标域广义真实文本的元素组合, 直到确定基本元素及其构成的全域, 并以此作为反过来判定元素组合的基准参照系, 第二, 确定应对参照系: 从已知域的元素组合中选择具体的进化形式, 涉及基本元素的时间序列和空间结构乃至元素组合的整合架构或框架, 作为进一步判定复用的元素组合的具有明确针对性的应对参照系。

目标基本元素在基准参照系中的波、 粒、 场特性进行全域定位, 对目标元素组合在应对参照系中的时空变换特性进行自动对应, 判定本真信息元素及组合与相应的符号形象、 载体载能、 意向意识的基因文本元素及组合之间的相互关系, 进而识别并理解广义真实文本所表达的本真信息以及主体的意向意识。

基因信息元素, 通常以符号形象或载体载能的某一种或多种形式体现, 例如: 26个英语字母(文字基因文本元素) 又如: 4个核苷酸碱基(生物基因文本元素)

全域, 由所有的基本元素构成, 是对一定时空条件下基本元素构成的元素组合进行定位分析的基准参照系。 例如: 通过统计字母在字母组合中的序位和统计字母以字母组合被复用的次数, 可以区分字母组合在相应的时空条件下的词素、 词、 词组、 句、 段、 篇、 章等具体进化形态。 同理可以区分由核苷酸碱基构成的密码子、 氨基酸、 蛋白质、 细胞、 微生物、 植物、 动物、 高等动物、 人类等具体进化形态。

2 以本真逻辑为序(化无序为有序) 步骤是:

第一, 采用实数(a 指代本真信息, 第二, 采用虚数(bi&) 标识广义文本(涉及: 符号形象,包括图、 文、 数、 表、 音、 像等多元基因文本类型) , 第三, 在基本元素的层次上确立体现本真逻辑的文化基因通式(a + bi&) , 使其它所有的符号形象及载体载能乃至意向意识的各种进化形式体系统统简化成为文化基因通式的某一类型的广义基因文本组合。

a + bi&) 的代数形式是多元数系、 几何形式是曲面空间、 分析工具是曲面坐标, 四元数及复数都是它的特例形式。

基因文本的全域数码化, 相当于给每一个基因文本元素镶嵌了一个唯一的体表特征”——全域数码, 基因文本组合随之也由全域数码组给大上了相应的烙印

由此可见, 全域数码体系是统一多元基因文本的标准参照系 这就是对广义真实文本进行协同操作的依据。 有了 它, 不仅人类智能主体对各个具体的形式体系进行协同操作成为可能, 而且, 人类智能主体与人工智能主体协同运行也成为可能

3 明确代码与载体(变失控为可控)  步骤是:

第一, 给多元基因文本元素镶嵌全域数码, 并设置相应的单元载体, 即: 由式到码(文) 到卡(物) ,进而, 随着时空变换, 由码(全域数码) 到组(全域数码组)  由卡到表。 这就是对广义真实文本进行去冗存要处理(含广义和狭义的处理) 的定位工具

第二, 明确产品形式: 1 只处理数字化的全域数码的网络(包括全域数码化出版物和终端)  2、用于自然人识别的全域数码化出版物(包括: 公开和保密、 专用和通用、 共性化和个性化的出版物, 用于机器识别的全域数码化终端。

01-.png

1是本发明的数学模型原理图。

02-.png

2是本发明的物理模型原理图。

图3-.png

3是本发明的技术性能一览表。

图4-.png

4是本发明的知识工程示意图。

图5-.png

5是本发明的产权监管示意图。

图6-.png

6是本发明的默契通信示意图。

本发明的有益效果或好处是:

建立基准参照系及应对参照系, 解决因知识信息错位而引起的冗杂文本、 非标形式、 垃圾信息、 知识爆炸和怪圈悖论等难题。

 

打个比方来说, 上述这些难题就好比是一团乱麻。 采用现有理论的范式和现有技术的办法就是:

要么是快刀斩乱麻, 这是从整体介入的通常作法; 要么是慢慢地去理, 这是从局部介入的通常作法;

要么是: 先把这团乱麻分成一堆一堆的小团, 再分别从各个小团的内、 外两个方面逐步深入地去理或斩(注: 最后能否解决这团乱麻带来的所有问题, 就要另当别论了! 一方面, 要看这团乱麻本身乱的性质及程度, 另一方面, 则要看你是否真正想要解决问题或打算把问题解决到什么程度)  这是先整体、 后局部, 乃至不断往复逐步深入的方法。

 

本发明采用的方法则是: 好比是先给这团麻绳一根一根地染上色, 有的甚至再编上号(即: 从全域基因文本元素的统一编号入手)  然后, 再针对具体情况(如: 已知域基因文本组合) 并考虑实际需要(如: 目标域基因文本组合)  既有根据又有针对性地, 选择不同的颜色及编号(如: 确定具体的参照系乃至参照系的组合)  或分、 或斩、 或理(悉听尊便!  

这实质上指出了解决知识信息的计量及测度难题的最佳途径 并且, 从方法及产品两方面给出了简明的示范。 例如: 基准参照系的应用及其效果, 充分体现了人工智能主体以高速运算和海量存储支持的演绎及完全归纳优势, 表现为对数据的狭义处理和广义处理的发散或收敛的精密性或专一性 应对参照系的应用及其效果, 则充分体现了人类智能主体以跨时空的联想、 想象、 灵感、 直觉支持的类比及非完全归纳优势, 表现为对知识或信息的狭义处理和广义处理的发散与收敛的易变性或多元性(实质上也就是粗放性或通用性)  有必要通过协同运行, 使它们优势互补; 从载体方面看, 就是要克服物理载体的机械性和生物载体的易变性, 即实现人机之间的取长补短。

由此可见, 本发明的重要性、 必要性和可行性, 不仅易于理解而且容易证实。

如果能够逐方面、 逐阶段、 逐层次、 逐系统地实施本发明, 那么知识信息的计量及测度这一国际难题的解决必将成为现实。 那时, 人类利用知识信息的整体水平和综合效能必将显著提高。 进而, 必将促使人工智能与人类智能的优势互补 形成效率更高的协同智能, 促成形式信息革命向语义信息革命的时代飞跃

从性能方面看, 本发明, 既可在信源端一劳永逸地解决非标形式的识别难题, 又可通过信道实现默契通信以及借助交换终端实现一通百通的形式变换(包括多种语言乃至多元基因文本形式的通译)排除冗杂文本的干扰, 还可在信宿端利用一元基因文本直接走短程捷径(防止或避免垃圾信息、 知识爆炸和怪圈悖论)  进一步, 还可利用本发明对广义真实文本中涉及的知识信息进行自动测评, 包括数量计算和价值评估。

总之, 本发明通过人工智能与人类智能、 电脑与人脑、 电信网与神经网的优势互补, 不仅能够显著地提高协同智能主体的效率及效能, 而且能够显著地改进现有技术这种在总体上仍是高消耗、 低效率的知识信息处理方式。 因此, 本发明不仅是工业化向信息化转换的利器, 而且是形式信息革命阶段向语义信息革命阶段转变的利器, 其应用涉及算、 产、 学、 研、 用等各个方面, 适用于一切需要加速信息化进程以及需要进一步提高信息化工程的质量的国家或地区的法人及自然人。

实施例1

全域数码化网络, 是由码、 卡、 表、 库、 网、 端构成的融智网络(RZ-net  其中, 码与其它具体的式之间具有对应转换关系, 整个系统表现为纯数字形式和纯载体形式的交集, 其特征在于: 以码代式进行知识信息数据处理; 纯数字形式, 采用(a+bi&) 的形式语言编制源程序, 以(a+bi&)与(0&1 的交集作为编译程序; 纯载体形式, 采用卡、 表、 库、 网、 端的具体形式承载码。

纯数字形式, 由基准参照系和应对参照系构成。 其中, 包含纯数字系统的全域基本元素通式与元素组合特式的演绎法则, 即: 全域基本元素0 1 2 3 4 5 6 7 8 9构成基准参照系, 其它所有的数字都可由前述阿拉伯数字的组合构成, 包括根据已知域运算符号及公式等数学法则及原理由基本元素衍生或派生各种各样的组合形式, 涉及相应的时间程序和空间结构以及它们的整合架构或框架,各个具体的应用系统选择相应的目标域基因文本组合形式体系构成应对参照系。 只要识别上述通式或基准参照系, 同时, 又选择适当的特式或应对参照系, 就能使电脑与人脑的优势互补, 而且能使一劳永逸地复用已建立的基准参照系及应对参照系。

实施例2

全域数码化出版物, 是由码 式、 卡、 表、 库、 网、 端构成的融智出版物(RZ-print for client/server 由于码与其它具体的式的对应转换或联系, 整个软件系统表现为纯数字系统的子集与其相应的具体的式的子集的交集或并集, 如: 以(bi&) 表示的图、 文(注: 狭义的文) 、 数、 表、音、 像等各种具体的基因文本形式, 其特征在于: 码式并行的知识数据处理方式, 即从广义真实文本中提取的多元基因文本元素及其组合构成的基准参照系及应对参照系, 与纯数字系统中相应数元的基准参照系及应对参照系一一对应, 其中, 码式并行还表示每一个具体的基因信息元素及组合都是被相应数元的码式并行地为卡所承载的。

因为义、 文(注: 广义的文)  物、 意, 分别与(a + bi + cj + dk 一一对应, 所以图、 文(注:狭义的文) 数、 表、 音、 像, 分别与(bi&) 一一对应。 其中, 广义的文, 包括图、 文、 数、 表、音、 像; 狭义的文, 包括各种各样的语言文字或符号体系。

由此可见, 实施例1与实施例2编号排位对号入座的关系。

全域数码定位方法, 就是给基因信息及基因文本编号排位 其步骤是: 1 编号: 在(a + bi&) 代码体系与(0 & 1 数字体系之间建立一一对应关系, 从而, 构成全域数码体系, 即本发明的系统软件; 2 排位: 在码与卡之间建立一一对应关系, 进而, 构成卡、 表、 库、 网、 端一体化的全域定位体系, 即本发明的硬件形式, 其中, 卡为码的物化展示单位, 表为码的物化操作界面, 库、网、 端是码的集中、 分布、 整合的物化结构形式。 如: 实施例1的纯形式系统。

纯文本系统及纯数码系统, 就是在纯形式系统中, 对已知域及目标域真实文本涉及的基因信息及基因文本进行对号入座。 也就是在融智网络中使其它基因文本元素及组合各即各位。 其步骤是:

1 对号: 在全域数码体系中给其它多元基因文本元素及组合进行代码定位 2 入座: 在全域定位体系中给其它多元基因文本元素及组合进行载体定位;(3 从真实文本中提取已知域基因文本,构成集大成共享基因文本(包括: 数码文本) 数据系统; 剪接或重组目标域基因文本 构成集小成独享基因文本(包括: 数码文本) 数据系统。 如: 实施例2及实施例3

动、 静态一体化的融智出版物, 主要有两种产品类形: (甲) 是常例, 即已知域集大成共享广义文本, 通常以融智网络交换端服务器共享数据库(server GXsjk 的形式发挥集中式全域数码化多媒体图书馆或百科全书的作用; (乙) 是特例, 即目 标域集小成独享广义文本, 往往以用户端计算机或其它终端机独享数据库(client DXsjk 的形式发挥分布式全域数码化多媒体百科全书(如: 摘要、选集、 分册、 简写本等个性化图书) 的作用。

一方面(甲) 是由(乙) 聚汇并合并同类项而成, 另一方面, (乙) 是对(甲) 有选择的复制或复用; (甲) 和(乙) 都可依托融智网络的支持, 对真实文本协同实施域位解析, 从而, 均可自建相应的全域数码化广义文本数据系统; 不仅(甲) 与(乙) 之间, 可互为信源和信宿, 而且, (甲) 的子集之间或(乙) 的子集之间, 也都可以互为信源和信宿。

通过在纯数字系统相应数元的基本元素通式及元素组合特式与其它相应的多元基因文本元素通式及组合特式之间建立一一对应关系, 即可实现任意一个基因信息元素及组合的同义的多元基因文本元素及组合相互之间的一通百通或并列通译。 只要识别通式或基准参照系, 同时, 又能选择适当的特式或应对参照系, 就能把电脑的演绎能力与头脑的直觉能力相结合使本发明产品在处理知识信息时发散与收敛得更到位, 从而, 可以准确无误地判定每一个知识点及表达式在整个知识及基因文本体系中的地位、 作用和意义。

如果说知识系统工程的任务是建立其它相应的多元基因文本元素通式及组合特式 那么文化基因工程的任务就是在纯数字系统相应数元的基本元素通式及元素组合特式与其它相应的多元基因文本元素通式及组合特式之间建立一一对应关系。 实施例2关于知识系统工程的任务及对策或办法举例说明如下:

1 以基本几何图形构成纯图形文本的基准参照系, 根据已知域几何图形组合及其变换法则, 派生出更多的更复杂的组合形式, 各个具体的应用系统选择相应的目标域基因文本组合形式体系构成纯图形文本的应对参照系。

应用示例: 建立广告图案(特别是其中的商标类 工业制图、 电子地图、 建筑制图、 模型图、 速写、 素描、 油画、 国画等具体的基因文本共享数据库。

2 以基本字母或基本笔画构成纯文字文本的基准参照系 根据已知域字母或笔画组合(如: 词素、词、 词组、 句、 段、 篇、 章) 及其原理或法则以及相应的标点符号及使用法则, 派生出更多的更复杂的组合形式, 各个具体的应用系统选择相应的目标域基因文本组合形式体系构成纯文字文本的应对参照系。

应用示例: 通过对用现有技术制作的字典、 词典和各种各样的语料库进行改造使之全域数码化,建立词素、 词、 词组、 句、 段、 篇、 等各种语言文字的基因文本共享数据库。 除此之外, 特别需要对各个学科、 各个产业、 各个领域的知识信息文献(包括教科书、 专业著及论文、 普及读物等) 进行全域数码化改造, 建立版权类、 Know-why类、 专利权类、 Know-how类的基因文本共享数据库。

3 以基本数字(如: 阿拉伯数字0 1 2 3 4 5 6 7 8 9 构成纯数字文本的基准参照系,根据已知域数字组合(如: 不同数系的数以及数学形式) 及其原理或法则以及相应的数学符号及使用法则, 派生出更多的更复杂的组合形式, 各个具体的应用系统选择相应的目标域基因文本组合形式体系构成纯数字文本的应对参照系。

应用示例: 建立从小学到博士后不同层次的几何类、 代数类、 分析类的基因文本共享数据库。

4 以基本表格或图表构成纯表格或图表文本的基准参照系, 根据已知域表格或图表组合及其原理或变换法则, 派生出更多的更复杂的组合形式, 各个具体的应用系统选择相应的目 标域基因文本组合形式体系构成纯表格或图表文本的应对参照系。 应用示例: 建立各种程序、 结构以及框架的简表及详表共享数据库。

5 以基本音素或音阶构成纯声音文本(语音或音乐) 的基准参照系, 根据已知域音素或音阶组合(如: 音节及言语片段或旋律及乐曲) 及其原理或法则, 派生出更多的更复杂的组合形式, 各个具体的应用系统选择相应的目标域基因文本组合形式体系构成纯声音文本(语音或音乐) 的应对参照系。

应用示例: 建立国际音标、 音节、 不同语言的词语以及言语片段等版权类基因文本共享数据库;建立不同音调的音阶以及各种各样的旋律及乐曲等版权类基因文本共享数据库。

6 以基本透视图及三视图和基本色彩及色调构成纯视像文本的基准参照系, 根据已知域视图组合和色调变换(如: 各种自然物及人工物的立体或活体影像) 及其原理或变换法则, 派生出更多的更复杂的组合形式, 各个具体的应用系统选择相应的目 标域基因文本组合形式体系构成纯视像文本的应对参照系。

应用示例: 建立广告、 工业制图、 电子地图、 建筑制图、 模型图、 教学演示、 经济模型、 产品模型、 虚拟模拟、 电影电视节目等版权类基因文本共享数据库。

7 以基本粒子构成纯立体文本(物质) 的基准参照系, 根据已知域粒子组合(如: 原子、 分子以及各种具体的物质) 及其原理或法则, 派生出更多的更复杂的组合形式, 各个具体的应用系统选择相应的目标域基因文本组合形式体系构成纯立体文本的应对参照系。

应用示例: 建立全域数码化博物馆、 文物馆或历史馆、 太空馆等共享系统。

8 以碱基构成纯活体文本(生物) 的基准参照系, 根据已知域碱基组合(如: 密码子、 氨基酸以及各种具体的生物) 及其原理或法则, 派生出更多的更复杂的组合形式, 各个具体的应用系统选择相应的目标域基因文本组合形式体系构成纯活体文本的应对参照系。

应用示例: 建立全域数码化生物馆、 标本馆等共享系统。

实施例3

全域数码化终端, 是由式 、 码、 卡、 表、 库、 网、 端构成的融智终端(RZ-client/server 整个系统表现为多元基因文本的一元数码文本形式, 其特征在于: 以码代式进行信息数据处理, 在融智网络支持下, 以动态形式的融智出版物的简式或省略形式进行远程协同操作及知识数据处理。

由此可见, 实施例3是以实施例1和实施例2为依托进行知识产权监管和默契通信的全域数码化终端, 主要以适合与其它终端进行直接通信的形式或方式发挥整合式全域数码化多媒体情报站的作用。

如: 随时对号入座地复用并复制新的或发现并公开新的基因文本元素及组合; 在端与端之间互通有无或默契通信。

由于依托融智网络及融智出版物, 融智终端可随时复制或复用任何领域的知识信息数据或基因文本, 因此, 不仅交换服务终端可以根据一元数码文本再现并提供相应的多元基因文本给用户, 而且用户终端也只须存储有限的个性化信息数据(而无须重复存储冗余的知识数据, 特别是通常无须重复存储冗余的多元基因文本, 需要时只须以简式或省略形式) 就能够进行海量的知识信息数据处理。 融智终端不仅能自动对付冗余文本或垃圾信息干扰, 而且能在基因文本的海洋中发现短程捷径。

以下结合附图和实施例, 对本发明作进一步说明:

在图1中, a + bi &) 表示多元数系的一般形式 a0+{ a1 a2 表示实数或实部的一般形式a0+{ a1 a2 bi &) 表示虚部的一般形式。 多元数(a + bi &) , 由实部(a 和虚部(bi &) 两部分构成。 实部或实数(a 指代本真信息, 其中, 每一个具体的数字(a 都表示基因信息元素(涉及已知域及未知域在实数集合中的一个特定序位; 虚部(bi &) 对应于多元基因文本, 每一虚数元(bi 都标识一类基因文本, 如: 标识图、 文、 数、 表、 音、 像(包括立体与活体的文本形式) 进一步包括标识多语种、 多物种或多学科(注: 每一个学科都有一套相应的形式语言)

全域数码定位系统, 是由基准参照系及应对参照系构成的全域数码化网络。 其中, 基准参照系,由全域基因文本元素0 1 2 3 4 5 6 7 8 9构成; 应对参照系, 通过选择适当的目 标域基因文本组合构成, 而各种各样的基因文本组合则是根据体现已知域相应的法则的其它数学符号和基因文本元素共同衍生出来的。 作为确定具体基因文本的定位工具的参照系, 其中, 每一个数码都有一个特定的序位, 每一数段都对应于一个基因信息元素(a 和多类基因文本元素(bi &) 。

本发明对语义信息及真实文本的量化处理, 就是借助文化基因通式的简式即多元基因文本通式(a+ bi &) 对特式或特例的解析而实现的。

在图1中, 已知域(m n 和未知域(x y 涉及指代义、 文(注: 物可以被视为立体与活体文本, 也可以用动态的音、 像文本虚拟表示) 的全域数码; 目标域(a b 涉及意——智能主体选择基因信息(即本真信息) 及基因文本(即形式信息) 的过程及状态。 (a b 尽管通常只是(m n)的子集, 但也可是(m n 的并集, 还可涉及(m n 与(x y 的交集。 m n 与集大成共享基因文本数据库GXsjk属于同一范畴; a b 通常与集小成独享基因文本数据库DXsjk属于同一范畴。

基因文本元素集合是完全归纳集 基因文本结构集合则多数是相对完全归纳集(因为它也有一部分是完全归纳集) 

全域数码集合具有完全归纳(或完全演绎、 或完全类比) 的特性。

设: a = b + c + d +, 则:  b & c & d &, 即: 本真信息元素集合是唯一的全集, 属于完全归纳范畴 广义文本的多元基因文本各子集即基因文本元素集合也属于全归纳范畴。 又: a +bi &a + cj &a + dk &, 或: (a + bi =a + bi & cj & dk &) , 所以, (a + bi)是(a + bi + cj + dk + ) 或(a + bi &) 的复部, 即: 复数域暨复平面是智能主体出入多元数系多维空间(包括四维时空 文化基因及其代码进行选域定位的转换界面。

本发明通过一系列量化转换界面出入多元数系暨多维空间基因信息及基因文本的元素组合进行选域定位 选域是选择虚数元, 从而识别基因文本类别或通式; 定位是在通式中确定具体代码的位置、 位移及轨迹, 体现为一系列代码组或特式。

1表示全域数码文本形式的文化基因通式(a + bi & cj & dk 的最简表达式(a + bi & 

这一数学模型集几何类、 代数类、 分析类于一体, 涉及全域数码异义排列、 同义并列、 经纬阵列、多维选列, 在图2中表现为物理模型即量化转换界面 文化基因通式中包含许多具体的多元基因文本类型bi &) 。

同一基因信息的多元基因文本(包括标准与非标形式)  可以通过同义并列实现通译或对应转换。

无论是借助一元数码文本通式及其量化转换界面 最简单且最经济的方式 直接处理本真信息(即:走思维捷径)  还是选择具体的多元基因文本通式及其量化转换界面 以具体的用户最熟悉的形式,间接处理衍生形式或广义文本(即: 寻找联想短程线)  都必须依托统一的文化基因通式 因为它的全域数码包含了 所有的多元基因文本通式(包括已知域及未知域 

具体智能主体的DXsjk或(a b 的聚会, 可简化通约为GXsjk或(m n m n 逼近(x y)的过程是通过用户对相应的a b 具体操作实现的 借助共享网络(GXnet 和相应终端的协同运行,通过具体的计算、 复制、 复用、 交换(或交流)  共享, 任何一个DXsjkGXsjk之间, 都能够在全域数码化的条件下进行比较甚至互换。 选域定位、 协同操作和去冗存要, 就是建立在这种可比性的基础之上的。 正是基于此, 对语义信息及真实文本的定性分析、 定量分析和结构分析, 才能通过文化基因通式及其量化转换界面对每一特式或特例定位分析而实现。

在图2中, 活页卡(K 和活动表(B 构成文化基因通式的最简物理模型 自动统计基因信息元素与自动计量基因信息组合, 是通过基因文本元素及组合(如: 结构、 程序、 框架等) 的复用次数(注:统计全域数码和计量全域数码组) 或复制件数(注: 计算活页卡的数量) 自动统计及自动计量而实现的。

码、 卡、 表, 是计量并操作基因文本元素及组合的基本工具。 人(个、 群、 类) 关于各物种、 各语种、 各学科的知识(意) 与宇宙万象(物、 文) 及其机理或其运行法则(义) 是否一致? 只有在文化基因通式中通过对基因信息及基因文本的协同量化处理 才能做到既见树木又见森林 码、 卡、 表、库、 网、 端的有机统一, 使智能主体可以对语义信息及真实文本进行高效率、 低消耗协同量化处理。

本发明对广义真实文本中的基因文本元素及组合选域定位、 协同操作和去冗存要, 就是通过一系列记录并承载基因信息元素及组合的量化代码及活页卡的处理而实现的。

1和图2是通过实施例1从纯形式的角度说明本发明

码、 卡、 表、 库、 网、 构成全域数码定位系统完整的产品形式 包括:

1 全域数码系统软件(其中的量化转换界面是协同操作系统) 及硬件, 由实数代码及虚数标识与二进制数字一一对应而构成的全域数码化网络

2 基因文本元素子系统 是存储与全域数码体系各子集相对应的图、 文、 数、 表、 音、 象等基因文本元素的原型或样品的代码数据系统 它是以码、 卡、 表的形式表达的基因文本元素及组合的共享全域数码数据库(与实施例2所述的多元基因文本数据库相对应) 及硬件, 全域数码化出版物 其内容是编译程序(其各个子集则分别与相应的多元基因文本元素构成的各个全域一一对应) 

3 用户应用子系统 是用户选择的已知域基因文本系统(如: 集大成共享基因文本数据库和共性化共享基因文本操作系统及载体) 目标域全域数码系统(如: 集小成独享全域数码数据库和个性化独享全域数码操作系统及载体) 全域数码化终端

在图3中, 根据集小成独享数码文本数据库(DXsjk 与集大成共享基因文本数据库(GXsjk 之间的关系(即: 它们所指代和承载的基因信息之间的等量关系, 通过计算相同的全域数码及全域数码组的数量而判定)  从算、 产、 学、 研、 用几个方面, 说明本发明的以下基本技术性能及功效。

1 计算全域数码组基因文本组合 DXsjk等于GXsjk时, 机器自为, 即以自动统计的计量方式,进行代码化文化基因的演绎或完全归纳或完全类比推理。

2 复制全域数码组基因文本组合 DXsjk大于GXsjk时, 人教机为, 即以一劳永逸的生产方式,由用户指导机器学习——基因文本标准化, 即对位识别。

3 共享全域数码组基因文本组合 DXsjk小于GXsjk时, 机教人为, 即以短程捷径的学习方式,由机器启发用户顿悟——基因信息载体化, 即定位理解。

4 交换全域数码组基因文本组合 DXsjk不等于GXsjk时, 人机共为, 即以默契通信的研究方式, 调适人机各方直觉——主体行为法制化, 即约定交流。

5 复用全域数码组基因文本组合 DXsjk小于GXsjk时, 机代人为, 即以一通百通的应用方式,有关子系统协同联想——选域定位自动化, 即移位表达。

4表示现有科教知识体系支持的知识工程与本发明的文化基因全域数码文本通式支持的文化基因工程之间的关系。

在图4中, 全域数码(No.  及全域数码组(Nos.  分别指代多元基因文本元素及组合。 全域数码化的活页卡(K 专门承载基因文本元素及组合 箭头表示各个方面、 各个阶段、 各个层次和各个系统的知识信息以全域数码化和活页卡片化的形式进入集大成共享基因文本数据库或集小成独享数码文本数据库。 协同智能主体通过活动表(B 展示量化处理语义信息及真实文本中的基因信息及基因文本的过程, 如: 对本真信息一劳永逸的复用、 对基因文本一通百通的复制、 对标准与非标形式的基因文本的并列通译。 1/n是代数符号。 =表示GXsjknDXsjk 在网络的支持下基因信息总量的动态守恒。

由基础知识、 专业基础知识、 专业知识等构成的层次阶梯, 表示以码、 卡、 表、 库、 网、 端的形式对现有知识体系进行全域数码化改造的内容。

4通过实施例2从多元基因文本的角度说明本发明

5和图6通过实施例3分别从网络(整体) 与终端(局部) 两方面说明本发明, 涉及网络知识产权监管(图5 和终端之间的默契通信(图6

5表示由已知域及目 标域基因文本支持的网络知识产权监管体系。 在图5中, 1/n是代数符号。

共享数据库(gxsjk 独享数据库(dxsjk 国际互联网(internet 和局域网或内联网(intranet)是现有技术。 它们均采用真实文本与二进制数字一一对应的数据转换模式或处理方式。 由二进制数字和逻辑电路构成的共享通信网(GXnet 是连接现有技术与本发明技术的纽带。 本发明采用全域数码及全域数码组与逻辑电路一一对应而构成的协同智能通信网或融智网络(RZ-net 是以集大成共享基因文本数据库(GXsjk 和集小成独享基因文本数据库(DXsjk 为支持的知识信息数据处理系统。 等号表示在连网的条件下GXsjkDXsjk可以是并集。 本发明对网络知识产权的监管, 是通过对全域数码及全域数码组的监管而实现的。 对已知域、 未知域、 目标域的基因信息及基因文本的知识产权监管都是以公开或许可的方式体现的。 其步骤是: 首先, 从真实文本中提取基因文本; 然后, 再将基因文本全域数码化, 以便对复用或复制的数量进行统计或计算。

这就把网络中繁杂的语义信息及真实文本的知识产权监管简化为对全域数码及全域数码组的自动统计和监管。

6表示由已知域及目 标域基因文本支持的各终端之间的默契通信。

在图6中, 信元装拆设备(CLAD 和异步转移模式(ATM 是现有技术。 它只传输与真实文本一一对应的信元及信息段(即: 二进制数字) 而与文化基因全域数码及全域数码组无关。 本发明技术则传输与全域数码组一一对应的二进制数字, 通常不必直接传输全域数码文本以外的其它多元基因文本,更不必直接传输真实文本。 信道只传输二进制数码, 终端才存、 处全域数码组(Nos.  以及相应的多元基因文本, 并根据用户需要再现真实文本或重构目标文本。 用户可以根据实际需要, 至少在以下三个层次实现全域数码组以及基因文本组合与真实文本之间的对应转换, 即: 在交换机之间; 在交换机与终端机之间, 包括在CLAD与非ATM终端机之间; 在终端机之间。

 

本发明的又一种表述如下:

 

本发明是处理语义信息及真实文本的文化基因工程方法及产品 具体包括:

一、 文化基因工程方法, 步骤是:

1 在复数代码体系与二进制数字体系之间建立一一对应关系, 从而, 构成对指代文化基因的全域数码及全域数码组进行全域定位的数学模型。 它涉及已知域及未知域, 相当于一个拥有无穷多个座位及编号的超级剧场的号码体系

2 以卡为单元载体, 在码与卡之间建立一一对应关系, 用表对之进行操作, 以库、 网、 端的形式,构成对承载基因文本的元素卡及结构卡进行全程扫描的物理模型。 涉及目标域, 它相当于上述超级剧场的座位体系

3 由码、 卡、 表、 库、 网、 端, 构成全域数码定位系统 如: 实施例1 它相当于该超级剧场的整个号码座位体系; 从真实文本中对号入座地自动提取相应的基因文本, 从而, 构成自由剪接或任意重组已知域及目标域基因文本的柔性加工用户模型, 如: 实施例23 它们相当于该超级剧场的以下入场情形, 即: 实际入场(有入场者, 即已知域其它多元基因文本) 和虚拟入场(无入场者, 只有目标域其它多元基因文本的代码) 两种情形

二、 文化基因工程产品的三个实施例: 1 号码体系座位体系构成的纯形式系统产品,它相当于该超级剧场的整个号码座位体系; (2 实际入场的已知域及目标域其它多元基因文本构成的纯文本系统产品; (3 虚拟入场的已知域及目标域全域数码文本构成的纯数码系统产品。

域、 位、 点、 式、 码、 卡、 表、 库、 网、 的含义及特征:

 即范围, 在此是指: 基因信息及基因文本元素构成的全域, 即文化基因通式及基因文本通式涉及的范围, 包括由派生的各种各样的基因文本组合构成的已知域、 未知域和目标域(注: 按智能主体对基因信息及基因文本的认知情况而划分) 

 即位置, 在此是指: 基因文本元素及组合在基准参照系及应对参照系中的位置或序位。

 即知识点, 在此是指: 基因信息元素及组合。

 即表达式, 在此是指: 多元基因文本元素及组合。

码, 即数码, 在此是指: 全域数码, 包括多元数及其二进制数字形式, 其特征是: 由(a+bi&)及其(0&1 形式体系构成全域数码体系, 并用它作为协同智能主体的标准语言或符号体系, 同时, 以复数系及复平面或曲面(a+bi&) 的形式作为出入多元数系及多维时空的量化全域切换界面(使基因文本元素可控的基准参照系成为操作界面) , 通过时空变换产生无数的量化子域切换界面(使基因文本结构或程序以及框架可控的应对参照系成为操作界面) 。 其中, 用实数指代异义排列的基因元素,用虚数标识同义并列的文本形式, 用多元数表示多维阵列的多种基因文本。 把已知域的其它多元基因文本简化为相应的全域数码文本, 以便于人机协同处理, 必要时再还原为相应的真实文本(通过基因文本通式给其它各种形式体系及元素选域定位——自动化的识别、 理解、 表达或通译) 。

卡, 即活页卡, 在此是指: 单元化操作页面, 包括电子和非电子形式, 其特征是: 元素卡用于承载多元基因文本元素, 附有异义单列的一个实部代码和同义并列的某个虚部标识; 程序卡是元素卡的时间序列形式; 结构卡是元素卡的空间排列形式; 架构卡是程序卡和结构卡的综合形式。

表, 即活动表, 在此是指: 多元化操作界面, 即各个终端协同处理知识信息和协同操作载能载体的传感传播界面, 其固化形式可是通用和专用芯片或光磁盘等, 如: 全域数码化的视窗操作界面及其各种应用软件, 其特征是: 它是由全域数码化的元素卡、 程序卡、 结构卡、 架构卡构成的多码多卡多维阵列(包括经纬阵列或多维选列)  附有异义排列的多个实部代码和同义并列的多个虚部标识; 用于逐方面、 逐阶段、 逐层次、 逐系统地展示文化基因, 并对之进行各种各样的排列组合。

库, 即数据库, 在此是指: 是由图、 文、 数、 表、 音、 像等多元基因文本元素及组合构成的全域数码化出版物, 其特征是: 以基因文本替代真实文本作为存储对象, 而且, 所有的基因文本元素及组合都全域数码化。

网, 即通信网, 在此是指: 是由全域数码体系和全域定位体系构成的融智网络, 其特征是: 以全域数码替代真实文本乃至其它多元基因文本作为传输对象。

端, 即终端, 在此是指: 是既能以用户最熟悉的某种文本形式进行人机对话, 又能在各个终端之间进行端到端默契通信的终端, 包括: 交换机、 服务器、 用户计算机、 数字电话机、 数字电视机、 数字家电、 传感器、 终端芯片、 IC卡乃至终端标识(如条形码和非电子化的活页卡) 等等各种具体的终端形式, 其特征是: 以全域数码替代真实文本乃至其它多元基因文本作为处理对象。

上述十个方面的相互关系:

如果把本发明的产品形式比喻为一个超级剧场, 那么, 域, 就是该剧场所有的座位及其编号可能涉及的任何一个范围, 涉及各个实在或虚拟的分剧场; 位, 就是该剧场的各个被实在或虚拟地设置或占用的序位; 点, 就是该剧场的座位及编号被实际或虚拟地占用的具体分布情形; 式, 就是该剧场的座位及编号被占用的情形的称谓或叫法, 涉及各种称谓体系; 码, 就是该剧场的座位的编号, 它是上述所有的称谓体系中的一种既最全面又最简捷的标准称谓体系或全域数码体系; 卡, 就是该剧场的最简捷的标准座位形式; 表, 就是该剧场的座位及编号指南或视频向导; 库, 是该剧场的座位编号的集中形态; 网, 是该剧场的座位编号的分布形态; 端, 是记录该剧场占用情形的装置, 包括出入口。

 

本发明方案涉及的部分创新概念的有关词语的基本含义说明如下:

1 文化基因, 是从与物化基因(如: 生物基因) 对应的观点提出的概念。 它包括基因信息及基因文本。 文化基因的提取, 是以活页卡的载体形式和全域数码的文本形式进行的, 实质上就是从广义真实文本中提取其它多元基因文本并对之进行文面表达。 文化基因的剪接或重组, 是以活动表的界面形式进行的, 实质上就是对基因文本组合中各个元素的序位进行剪辑或重构。 文化基因的提取、 剪接或重组的过程, 也就是各个智能主体对基因信息及基因文本进行选域定位、 协同操作和去冗存要的过程,即在用全域数码文本表达的文化基因通式中, 对具体的基因信息及基因文本的位置、 位移及轨迹进行全域数码定位。 文化基因的提取、 剪接或重组的结果或成果, 或集中、 或分布、 或整合, 以便于为用户复用或复制(含交流与共享) 

2 基因文本元素代码 是指代或替代其它多元基因文本元素的代码(a + bi&) , 如: 图、 文、数、 表、 音、 像等各类(bi&) 基因文本元素代码。

3 已知域基因文本元素, 是智能主体(包括: 人类智能、 人工智能、 协同智能等主体形式) 已知范围内的基因文本元素, 如: 图(基本几何图形)  文(拼音字母, 汉字的基本笔画)  数(如: 阿拉伯数字符号)  表(基本表式)  音(音素, 音阶)  像(基本的三视图, 三原色) 

4 异义排列、 同义并列、 经纬阵列、 多维选列, 是指在文化基因通式中, 基因信息的异义排列(a 、基因文本的同义并列(bi &  文化基因的经纬阵列(a + bi 多维选列(a + bi & 

5 基因文本组合代码 是相应的基因文本元素代码的组合

6 对位识别、 定位理解、 移位表达、 域位解析 是指在文化基因通式(a + bi &) 中借助多元转换界面对其它具体的多元基因文本进行对号入座[区别于不对号入座(即: 入场者座错位置) 或对号不入座(即: 虚拟入场) 的情形的过程。

7 全域数码, 是(a + bi &) 代码集合与(0 & 1 数字集合的交集的元素 采用复数形式的目的是对基因信息及基因文本进行全域定位 采用二进制数字或数据形式的目的是便于人工智能主体对之进行(广义的) 处理

8 去冗存要、 去冗处要、 去冗传要、 去冗馈要, 是由广义真实文本到基因文本(包括全域数码) ,以及由未知域到已知域再到目标域的收敛过程 涉及对知识信息数据的广义处理(即: 输入、 存储、处理、 输出、 传输、 反馈) 和狭义处理即: 分解与合成(含: 重构和重组) 

9 协同智能, 是人工智能与人类智能的协同运行方式。 协同智能主体是智能主体的一种进化形态。

10 基因文本元素, 是构成基因文本组合的基本元素, 如: 图、 文、 数(含全域数码) 表、 音、像等各个形式体系的基本元素。

11 全域定位, 是指: 基因文本元素在其所属的全域中都有特定的序位 所有因各个基因文本元素的时空变换而构成的基因文本组合(涉及已知域、 目标域、 未知域  在基因文本通式中都有各自相应的序位记录

12 协同操作, 是以量化转换界面(表)  把指代已知域图、 文、 数、 表、 音、 象, 以及各语种、各物种和各学科的基因文本, 码和卡进行分解与组合 以库、 网、 端的形式, 进行集中、 分布、 整合的处理, 以便人机协同探索未知域

13 基因文本组合, 是构成广义真实文本的各种基因文本程序、 结构、 框架, 它本身则由基因文本元素所构成, 如: 图、 文、 数、 表、 音、 像等各个形式体系的不同层次的程序或结构及框架。

14 横断扫描 是利用全域转换界面, 对广义真实文本中包含的基因文本, 进行逐方面、 逐阶段、逐层次、 逐系统的全域扫描或有针对性的搜索

15 分离与组合 是系统或用户利用全域转换界面 借助码和卡对广义真实文本中的基因文本,进行提取、 剪接或重组的基本操作。

16 去冗存要, 是指集小成独享基因文本或用户终端(可以是交换机、 服务器、 计算机乃至其它各种具体的个性化终端等等形式) 从广义真实文本中提取基因文本并全域数码化的过程。

17 全域数码文本, 全域数码及全域数码组这一特殊的基因文本形式。

18 柔性加工 在此是指系统或用户借助基因文本对真实文本的随意加工。

19 文化基因通式 是由义、 文、 物、 四元素构成的融智概念体系基因形式 其数学形式涉及: 复数、 四元数(特例) 乃至其它多元数的相应形式。

20 人机优势互补, 是指: 一、 人机两方面在知识信息数据处理领域的优势互补 如: 推理、 学习、 顿悟、 直觉、 联想等人类智能的优势与计算、 复制、 共享、 交换、 复用等人工智能的优势的协同互补; 二、 人机两方面在载体载能形式变换领域的优势互补 如: 生物载体的易变性等人类智能主体的特点与物理载体的机械性等人工智能主体的特点之间的协同互补。

21 自动测度(包括自动统计和自动计量  是指本发明对基因文本在全域中的序位记录(涉及复制、 复用、 共享、 交换的数量) 进行的自动计算。 如: 在整个网络中对某些全域数码组或基因文本组合的实际使用和交换数量的自动测量。

22 一劳永逸, 是指只要复制一次就能多次复用

23 短程捷径, 是指一劳永逸地共享已知域多元基因文本。

24 默契通信, 是指主体之间心有灵犀一点通的默契交流在全域数码化网络以及出版物或终端中的体现 即: 实部编号确定本真信息 虚部标号确定多元基因文本的类型 根据全域数码即可再现已知域多元基因文本及目标域真实文本。

25 一通百通, 是指全域数码化基因文本一通百通, 因为表示同一基因信息的多元基因文本实部编号一致 所以基因文本只要全域数码化就可以随时随地转换成为已知域多元基因文本的其它任何一种形式

26 本发明的应用涉及电信网(以tel. 表示) 广电网(以TV表示) 计算机网(以computer表示) 出版物网(以CPU IC CD-room or paper表示)

 

注释

         系统科学之窗 论文专区(2000-122005

         该发明已于20001129日在国家知识产权局的中国专利《发明公报》 1648期提前公开, 请号是001093800 公开号是CN1274895A 全文20088字, 六幅图解。 

         发明人兼著作权所有人: 邹晓辉(版权拥有者,专利权放弃者,专有技术和商业秘密的继续拥有者,更新的基础发明专利和配套专利的贡献者、给予者和赠予者)



https://blog.sciencenet.cn/blog-94143-1453449.html

上一篇:《智即信息处理》的总结与分析:Intelligence Means Information Processing
下一篇:融智学在人机互助新时代背景下的汉字汉语中文信息处理系统研究
收藏 IP: 116.31.52.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-1 13:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部