博文

大语言模型的言行一致性与DIKWP交互模型

已有 577 次阅读 2023-10-4 15:49 |系统分类:论文交流

大语言模型的言行一致性与DIKWP交互模型

段玉聪（Yucong Duan）

DIKWP-AC人工意识实验室

AGI-AIGC-GPT评测DIKWP（全球）实验室

DIKWP research group, 海南大学

duanyucong@hotmail.com

1. 背景

大语言模型，如GPT-4，因其强大的文本生成能力和广泛的应用潜力而受到广泛关注。然而，确保其产生的输出与预期和上下文一致，是一个重要而复杂的挑战。这导致了对模型的言行一致性的探索，即如何使其回答和行为与其给出的信息相一致。

2. 什么是言行一致性

言行一致性是指行为与所说的话相一致。对于大语言模型而言，这意味着其生成的文本需要与之前的上下文和给定的指令一致。

3. DIKWP模型与言行一致性

DIKWP，代表数据(Data)、信息(Information)、知识(Knowledge)、智慧(Wisdom)和目的(Purpose)，为我们提供了一个理解和解释模型行为的框架。

数据(Data): 原始输入，如查询或命令。
信息(Information): 模型对数据的第一次解读。
知识(Knowledge): 模型根据其预训练的知识对信息进行的进一步解释。
智慧(Wisdom): 模型对知识的深入理解，涉及多方面的关联和推理。
目的(Purpose): 模型为满足用户需求而采取的行动或给出的答案。

4. DIKWP在言行一致性中的应用

通过DIKWP，我们可以跟踪大语言模型的思考过程，从最初的数据接收到最终的输出产生。

4.1 场景分析

假设一个用户询问：“告诉我关于太阳能的优点。”

数据: “告诉我关于太阳能的优点。”
信息: 模型认识到用户想知道太阳能的积极方面。
知识: 模型根据其预训练的知识库开始列举太阳能的优点。
智慧: 模型不仅提供基本优点，还可能关联到环境、经济和技术进步等方面的考量。
目的: 最终为用户提供一份关于太阳能优点的详细列表。

4.2 问题与挑战

在某些情况下，模型可能会产生与期望不一致或与前文不符的回答。例如，当询问关于太阳能的优点时，如果模型回答“它们无法在夜间工作”，那显然是不一致的。

5. 确保DIKWP下的言行一致性

5.1 重复性检测

模型可以实施一种内部检查，确保其在DIKWP的每一阶段产生的答案都与前文和用户的原始查询保持一致。

5.2 上下文保留

在长对话中，确保模型记住之前的上下文，这样可以减少不一致的答案和行为。

5.3 用户反馈机制

允许用户指出模型的不一致回答，这样模型可以进行自我纠正。

6. 结论

DIKWP为我们提供了一个强大的框架，使我们能够理解和跟踪大语言模型的思考和响应过程，从而确保其言行一致。确保大型模型的输出与预期和上下文一致，不仅提高了用户的满意度，还增强了用户对模型的信任。

段玉聪，海南大学计算机科学与技术学院教授，博士生导师，第一批入选海南省南海名家计划、海南省领军人才，2006年毕业于中国科学院软件研究所，先后在清华大学、首都医科大学、韩国浦项工科大学、法国国家科学院、捷克布拉格查理大学、意大利米兰比克卡大学、美国密苏里州立大学等工作与访学。现任海南大学计算机科学与技术学院学术委员会委员、海南大学数据、信息、知识、智慧、意图DIKWP创新团队负责人、兼重庆警察学院特聘研究员、海南省委双百人才团队负责人、海南省发明协会副会长、海南省知识产权协会副会长、海南省低碳经济发展促进会副会长、海南省农产品加工企业协会副会长、美国中密西根大学客座研究员及意大利摩德纳大学的博士指导委员会委员等职务。自2012年作为D类人才引进海南大学以来，累计发表论文260余篇，SCI收录100余次，ESI高被引11篇,引用统计超过4300次。面向多行业、多领域设计了241件（含15件PCT发明专利）系列化中国国家及国际发明专利，已获授权第1发明人中国国家发明专利及国际发明专利共85件。2020年获吴文俊人工智能技术发明三等奖；2021年作为程序委员会主席独立发起首届国际数据、信息、知识与智慧大会-IEEE DIKW 2021；2022年担任IEEE DIKW 2022大会指导委员会主席；同年获评海南省最美科技工作者（并被推全国）；同年10月入选美国斯坦福大学发布的全球前2%顶尖科学家的“终身科学影响力排行榜”榜单。参与研制IEEE金融知识图谱国际标准2项、行业知识图谱标准4项。2023年发起并共同举办首届世界人工意识大会（Artificial Consciousness 2023, AC2023)。

转载本文请联系原作者获取授权，同时请注明本文来自段玉聪科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3429562-1404666.html

上一篇：DIKWP：打造人机沟通的新桥梁
下一篇：基于DIKWP的透明性与可信AI实现

收藏 IP: 140.240.38.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

段玉聪

扫一扫，分享此博文

YucongDuan的个人博客分享 http://blog.sciencenet.cn/u/YucongDuan

博文

大语言模型的言行一致性与DIKWP交互模型

大语言模型的言行一致性与DIKWP交互模型

段玉聪（Yucong Duan）

1. 背景

2. 什么是言行一致性

3. DIKWP模型与言行一致性

4. DIKWP在言行一致性中的应用

5. 确保DIKWP下的言行一致性

6. 结论

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

段玉聪

全部作者的其他最新博文

全部精选博文导读

YucongDuan的个人博客分享 http://blog.sciencenet.cn/u/YucongDuan

博文

大语言模型的言行一致性与DIKWP交互模型

大语言模型的言行一致性与DIKWP交互模型

段玉聪（Yucong Duan）

1. 背景

2. 什么是言行一致性

3. DIKWP模型与言行一致性

4. DIKWP在言行一致性中的应用

5. 确保DIKWP下的言行一致性

6. 结论

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

段玉聪

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)