|
DIKWP人工意识字、词粒度层级展现对应的处理过程
段玉聪(Yucong Duan)
DIKWP-AC人工意识实验室
AGI-AIGC-GPT评测DIKWP(全球)实验室
DIKWP research group, 海南大学
duanyucong@hotmail.com
假设我们有一段文本:“北京的天气非常好,风和日丽,我计划明天去长城游玩。”
数据(Data): 这个层次是对原始文本进行最基础的处理,包括分词、词性标注等。我们可以将整个句子分解为以下数据点:“北京”,“的”,“天气”,“非常”,“好”,“风”,“和”,“日丽”,“我”,“计划”,“明天”,“去”,“长城”,“游玩”。每个词语都是一个单独的数据点。
信息(Information): 在这个阶段,我们开始理解单词之间的关系,形成更高级的信息结构。例如,“北京的天气非常好”可以被理解为(主题:天气,描述:非常好,地点:北京),这是一个“偏序”的关系,因为描述词(非常好)修饰了主题词(天气),“风和日丽”可以理解为对天气的另一种描述。
知识(Knowledge): 这个阶段涉及到语义理解和背景知识的应用。比如,“我计划明天去长城游玩”这句话告诉我们一些知识点,如:长城是可以游玩的地方,“明天”意味着对未来的计划,“我”是行动的主体。这些知识都基于我们对常识和世界的理解。
智慧(Wisdom): 这个阶段是关于判断和推理的。例如,我们可以理解文本中的意图——“我”计划在好天气的情况下游玩长城。我们还可以推理出,这个计划可能取决于天气是否会持续良好。如果我们的AI系统是一个助手的角色,那么它可能会根据这个理解进行一些行动,比如查询明天北京的天气预报,以确保计划可行。
意图(Purpose): 这个阶段涉及到识别出本句话的目标。在这个例子中,可能的意图是传达信息(告诉别人“我”将去长城游玩),请求帮助(比如寻求建议或者确认天气状况),或者仅仅是进行社交交流(分享自己的生活和计划)。
DIKWP(数据-信息-知识-智慧-意图)的分析框架补充:
数据(Data):
元数据:除了分词,我们还可以从元数据中获取其他信息。例如,此句子的来源(是从社交媒体、邮件、或是新闻中获得的?)以及发布时间等。
信息(Information):
情感分析:从“北京的天气非常好,风和日丽”这样的描述中,我们可以得知该句子所传达的情感是积极的。
时间关系:“明天”提供了一个具体的时间信息,说明这是一个未来的计划。
知识(Knowledge):
文化背景:长城是中国的一个重要文化遗产,这也暗示了文本的地理和文化背景。
用户模型:通过分析用户之前的行为和偏好,我们可以更深入地了解“我”的身份特点,例如是否常常进行户外活动。
智慧(Wisdom):
风险评估:除了考虑天气,AI还可能会考虑其他外部因素,例如是否存在导致长城关闭的情况,或者与“我”之前的行为模式不符的其他情况。
预测:基于此句话和其他信息,AI可能会预测“我”是否真的会按计划行动,或者何时可能改变计划。
意图(Purpose):
行动驱动:如果这句话是对一个AI助手说的,那么它可能还包含一个隐含的请求,例如:“帮我查查明天的天气?”或“推荐一个长城的导游。”
反应识别:AI需要根据这句话识别出预期的反应。是期望得到一个回答、建议、肯定、还是其他的反馈?
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 06:35
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社