YucongDuan的个人博客分享 http://blog.sciencenet.cn/u/YucongDuan

博文

意图驱动的跨DIKW模态智能交互方法(指导的2021年5月本科毕业论文)

已有 1218 次阅读 2022-12-26 14:44 |系统分类:论文交流

Purpose driven intelligent interactive method crossing DIKWP



     

    文(设计)

     

     

     

       目:   意图驱动的跨DIKW模态智能交互方法

    (Purpose driven intelligent interactive method crossing DIKWP )                                                        

       号:   20171684310079                                                       

       名:   方照霖(Zhaolin Fang)                                                       

       级:   2017                                                                 

       院:   计算机科学与技术学院                                                           

       别:   计算机科学与技术                                                                            

       业:   计算机科学与技术                                                         

    指导教师:   段玉聪(Yucong Duan)                                                

    完成日期:  2021518


    摘要

    随着人工智能和大数据等相关技术的迅速发展和普及应用,在人们的日常生活和生产过程中,经常需要与各种智能体或设备进行交互。在此过程中,用户(人)和设备(机器)之间的交互过程由输入和输出两部分组成。在目前主流的交互方式中,站在用户感受的角度看待,用户输入主要由触觉和声音等组成,输出主要是视觉、听觉和触觉。然而,在实际应用场景中,用户可能会遇到障碍,无论是永久性障碍(如失明/耳聋),还是情境性或临时性障碍(如夜间驾驶/做饭/起床),都会影响用户对某些模式的感知或操作能力。换句话说,任何一种输出或输入模式在任何情况下都可能受到限制。因此,如何使计算机通过多模态输入来理解和预测用户的意图就显得尤为重要。

    本文通过为用户和机器建立面向对象的基于DIKW的意图计算模型和处理模型来构建一种智能交互方法,并在此基础上设计了一个智能交互开关照明系统,进一步验证该模型的可行性和正确性。意图驱动的跨DIKW模态的智能交互方便能够方便智能设备处理多模态的输入并识别用户意图,可以在输入具有多样性、不完整性、不精确性的情况下完成交互过程,最大可能地满足用户的意图,帮助提高人机交互效率。

     

    关键词:意图驱动;DIKW;智能交互;跨模态


    Abstract

    With the rapid development and popularization of related technologies such as artificial intelligence and big data, people often need to interact with various agents or devices in their daily life and production process. In this process, the interaction between user (person) and device (machine) consists of input and output. In the current mainstream interactive mode, from the perspective of user perception, user input mainly consists of touch and sound, and output mainly consists of vision, hearing and touch. However, in practical scenarios, users may encounter obstacles that affect their perception or ability to operate certain modes, whether permanent (such as blindness/deafness) or contextual or temporary (such as driving/cooking/getting up at night). In other words, any output or input mode can be limited in any case. Therefore, how to make the computer understand and predict the user's purposes through multi-modal input is particularly important.

    In this paper, we build an intelligent interactive system by establishing an object-oriented purpose calculation model and processing model based on DIKW for users and machines, and then design an intelligent interactive switch lighting system to further verify the feasibility and correctness of the model. The purpose-driven intelligent interaction system across DIKW modals can facilitate the system to process multi-modal input and identify user purpose. It can complete the interaction process when the input has diversity, incompleteness and inaccuracy. It can meet the user's purpose as much as possible and help improve the efficiency of human-computer interaction.

     

    Keywords: Purpose Driven; DIKW; Intelligent Interaction; Transmodal

     


    目录

    1 引言

    1.1课题研究的背景

    1.2 课题研究的意义

    1.3 课题研究的主要内容

    2 DIKW体系

    2.1 知识图谱与DIKW体系

    2.2 数据体系(

    2.3 信息体系(

    2.4 知识体系(

    2.5 数据、信息和知识的相互转换

    2.5.1 数据 数据

    2.5.2 数据 信息

    2.5.3 数据 知识

    2.5.4 信息 数据

    2.5.5 信息 信息

    2.5.6 信息 知识

    2.5.7 知识 数据

    2.5.8 知识 信息

    2.5.8 知识 知识

    3 意图体系

    3.1 意图体系介绍

    3.2 意图体系(P)的构建

    4. 意图驱动与意图计算

    4.1 意图驱动

    4.2 意图计算

    5. 实例分析——智能交互开关照明系统

    5.1 需求分析

    5.2 概要设计

    5.2.1 基本处理流程

    5.2.2 模块划分

    5.2.3 异常处理和反馈机制

    5.3 系统处理流程演示

    5.3.1 构建DIKW-P体系

    5.3.2 系统运行逻辑

    5.4 功能描述

    5.4.1 可编辑面板

    5.4.2 智能助理

    5.5 隐私保护问题

    致谢

    参考文献

     


    1 引言

    1.1课题研究的背景

    在传统的交互模式中,数据以各种不同的形式存储在数据库中以便在交互过程中使用,然而这样的方式在面对多模态的其他数据,如用户的动作、活动等抽象输入时,计算机如何理解、存储和运算这些构成交互输入输出的基础过程就难以实现。在传统的编程中,人们总是为不同的数据输入和逻辑编写不同的代码,这种方式下,程序的可重用性低,严重浪费计算资源。虽然通过模块化的方式可以一定程度上降低这一过程中的资源浪费,但效率不高。

    此外,不论是机器或是用户,在每一次交互过程中都伴随着本次交互的目的,即意图。在找到统一的数据处理逻辑的建模方式后,引入意图到处理过程中,关注交互的需求而不是交互过程,即可最小化重复编写代码等操作的资源浪费。

    在实际应用场景中,不是每一次交互系统都会获取完整的、有效的数据来支撑系统来运算出交互逻辑,系统获取的数据输入通常情况下是离散的、不完整甚至不正确的。对用户来说,他们想要的通常也不是最精确的交互结果,只要能满足用户的意图即可。因此,智能的交互系统应能在数据不完整的情况下得到不绝对精确但能满足用户意图的交互逻辑和结果,这样可以使资源利用率最大化。

    1.2 课题研究的意义

    随着人工智能技术和智能设备的普及,传统社区和人类日常生活的网络化,发展能应对多模态输入输出的智能交互系统是必然趋势。我们迫切需要一种高效、通用的方法来将尽可能多样的输入转换为计算机可处理的形式,并输出满足用户需求的结果。本文中提到的基于意图驱动的跨DIKW模态的智能交互方法,可以使用一种相对较统一的DIKW体系形式来建模在交互过程中所用到的各种离散数据,提高计算机的处理效率。结合意图模型以需求为导向完成交互,可以一定程度上减少计算资源浪费并且提高交互效率。

    1.3 课题研究的主要内容

    本文研究的主要内容是设计一个意图驱动的跨数据、信息、知识和智慧模态的智能交互方法。第2章主要介绍知识图谱技术,并将知识图谱划分为数据(D)、信息(I)、知识(K)和智慧(W)体系以及如何将现实中的各种离散数据映射到数据、信息、知识和智慧这四种形式并构建为DIKW体系;第3章在DIKW体系的基础上引入了意图的概念以及如何构建和使用意图体系来帮助人机交互过程;第4章设计了一种意图计算的方法,作为意图驱动的跨数据、信息、知识和智慧模态的智能交互方法的核心部分,意图计算用来在用户意图不完整等情况下来尽可能准确地推测用户意图,以意图作为驱动来进行交互逻辑输出;紧接着在第5章论述设计了一种智能交互开关照明系统来验证本文中所述方法的整体可行性;最后,与目前主流方法进行了对比并总结了本文方法的优缺点以及未来的研究方向。


    2 DIKW体系

    2.1 知识图谱与DIKW体系

    本文中的数据、信息、知识和智慧(DIKW)体系是对知识图谱技术的一种表达形式。知识图谱是由Google公司在2012年提出来的一个新的概念。从学术的角度,我们可以对知识图谱给一个这样的定义:“知识图谱本质上是语义网络(Semantic Network)的知识库”。知识图谱是一种用图模型来描述知识和建模世界万物之间关联关系的技术方法[1]

    知识图谱已被广泛应用,在很大程度上是由于其无模式的性质。它使知识图谱能够无缝增长,并允许根据需要创建新的关系和实体。知识图谱已经成为一种强有力的工具,它以有向图的形式表示知识,并为文本信息提供语义。知识图谱是将每个项目、实体和用户表示为节点,并通过边将相互作用的节点连接起来的图。知识图谱具有丰富的自然语义,能包含多种更完整的信息[2]。其表达机制接近自然语言。在Web视角下,知识图谱如同简单文本之间的超链接一样,通过建立数据之间的语义链接,支持语义搜索。在自然语言处理视角下,知识图谱就是从文本中抽取语义和结构化的数据。在知识表示视角下,知识图谱是采用计算机符号表示和处理知识的方法。在人工智能视角下,知识图谱是利用知识库来辅助理解人类语言的工具。在数据库视角下,知识图谱是利用图的方式去存储知识的方法。

    然而,知识图谱技术也面临挑战,比如多源异构数据难以融合、非结构化数据计算机难以理解、分散的数据难以统一利用等。现今资源的获取渠道多样,采集得到的资源总量多、种类复杂,但常见的资源处理方法例如数据挖掘等手段多关注于数据库等种类明确的资源,并且处理时往往也需要对采集到的数据指定特定的使用处理方案,这些方案的重用性不佳,难以迁移到其他类型的资源上去,而且这些资源加入没有一个统一的结构,计算机将会难以理解和处理。除此外,现有的资源处理方案对资源的利用效率较低,造成了很大浪费。针对这些问题,基于知识图谱将采集到的多类型跨模态混合资源统一划分为数据、信息、知识和智慧资源,对这些类型资源设定处理方案,可以提高智能交互方法的重用性和数据资源的有效利用率等,更深层次地挖掘出隐藏资源,达到诸如预测推理、资源补充、资源推荐等目的,使资源被更加充分地利用,减少资源浪费。

    本文从整体上阐明知识图谱的表达,分别从数据、信息、知识和智慧(DIKW)四个方面阐明了知识图谱的体系结构并提出将知识图谱以相互融合转化的方式表示为数据图、信息图、知识图和智慧图四种基本形式[3]。即知识图谱可以以上四种形式表示,且数据、信息、知识和智慧是在特定场景或对象下相对而言的,没有确定的分界,在不同场景下或不同对象下,他们三者可以重构和互相转换,生成新的数据、信息和知识。除此之外,DIKW的来源是多样的,不仅限于文本、数字等,也可来自于声音、动作等多种形式。这样,知识图谱除了可以进行搜索、推荐等应用与用户交互外,还具有了一定了语义推理、决策等能力[4],大大提高了交互效率和智能程度。下文将分别介绍DIKW体系以及数据、信息和知识的相互转化。

    2.2 数据体系(

    数据是世界可观察属性的符号表示。数据是通过观察数字或其他信息的基本单个项目获得的,但它们本身没有上下文,不与用户的某个特定意图相关联,没有任何意义[5]。数据的存储不会改变数据本身,但它有多种表现形式。诸如数组、栈、链表、文本等等。数据可以是结构化的、半结构化的和非结构化的、关系的或非关系的。本文中数据体系称为均以树或图的形式表示和存储,中的数据可能是任何形式、任何格式。

    由实体(Entity)和数据(Data)组成。每个实体包含若干个数据,且不存在没有归属的实体而游离存在于的数据。实体由输入的元数据实体化而来。实体与数据的关系表现形式为“包含(include)”,仅表示数据和实体间的归属关系。E(include(d))表示实体E拥有数据d

    2.3 信息体系(

    信息包括信息要素和信息要素之间的关系。信息体现了对某种关系的理解,信息现象的本质被描述为信息的发送者和接收者之间发生的通信过程。信息是通过关系连接赋予意义的数据。这个“意义”主要通过与意图体系联系起来,对数据体系中的数据和意图体系中此数据对应的意图推导。具体为,在数据体系的基础上给数据添加属性和语义,并记录获取此带有语义和属性的数据时,用户完成了什么意图,组成一个具有多层的树结构(在某些情况下可能会形成图)。这样可以透过意图推断两个实体(用户)之间的关系。此外,信息体系中的信息可在某种情况下转变为知识规则存储在知识体系中。本文中信息体系称为

    2.4 知识体系(

    知识是经过认知加工和验证而组织起来的信息,由经过结构化形式化的推导演绎获得。信息是获取和建构知识的必要媒介或材料。知识体系由知识规则组成,知识可以是通过多模态机器学习等相关技术,提取自信息体系中有价值的知识规则。知识也可能直接来自外界输入。知识与信息是不一样的,但具有共生关系。知识可以是显性的,比如书面的指导方针,也可以是隐性的,比如人们的经验和直觉。在智能交互系统中,知识的用途是为交互过程和系统决策提供支持,知识体系中的知识是系统预测、决策的基础,是对意图模型剪枝的依据,值得一提的是,知识体系中的知识也具有时效性,可以随时删除和更新以提高效率和准确度。本文中信息体系称为

    2.5 数据、信息和知识的相互转换

    2.1中所说,数据、信息和知识三种形式之间可以进行转化,生成新的数据、信息和知识[6]

    2.5.1 数据  数据

    包括实体和数据,某个实体对应的数据可以进行转换,不同实体对应的数据也可以实现转化。可分为以下几类:

    E1(include(d1)) → E1(include(d2))

    E1(include(d1)) E1(include(d2))→ E1(include(d3))

    E1(include(d1))  E2(include(d1))→ E1(include(d2))

    例如,从某用户(实体)的身份证号码可以查出此用户的籍贯,从用户(实体)每天工作的时间计算平均工作时间,从所有用户(实体)的年龄计算用户(实体)的平均年龄,如下所示:

    E1(include (ID)) → E1(include (Place))

    E1(include(Whour1)) ... E1(include(WhourN))→ E1(include(WhourAvg))

    E1(include(age))  E2(include(age))→ E3(include(ageAvg))

    2.5.2 数据  信息

    数据转化为信息主要基于用户的意图,若用户的数据产生于此用户的意图关联,则此数据可以反映出用户行为的动机或与另一个用户之间的关系产生对应的信息。这种转换可表示为:

     

    这里定义+” 为数据和意图之间的运算。例如,一名猎人外出打猎时带了一把伞,若此猎人的意图是遮雨,则可得到当前外面的天气是雨天,即猎人出门打猎时带了一把伞(D+ 遮雨(P= 猎人打猎时外面下雨(I);若此猎人的意图是将雨伞作为打猎工具,则可得到当前没有下雨,即猎人出门打猎时带了一把伞(D+ 打猎(P= 猎人打猎时外面未下雨(I)。

    2.5.3 数据  知识

    数据转化为知识可以通过两种方式实现。第一种是通过统计学原理将数据直接转化为知识,当数据的规模足够大时,就可以通过数据挖掘等技术来推理生成知识,以表达实体的总体发展规律或变化趋势。第二种是将互联网或书籍等信息资源中的数据直接作为知识存储在知识体系中。

    例如,通过统计所有学生用户的使用电脑时间,通过计算平均值可以预测下次出现学生用户时,此用户的电脑使用时间范围。

    2.5.4 信息  数据

    信息转化为数据的过程可以看作数据转换为信息的逆过程,将信息与意图剥离生成与实体相关的数据,即Information - Purpose = Data。这里定义“-” 为信息和意图之间的运算。

    2.5.5 信息  信息

    信息可以结合数据转化为新的信息,也可以两个或多个信息结合转化为新的信息。

    2.5.6 信息  知识

    信息到知识的转化是DIKW体系的核心部分之一,将信息经过抽象归纳等操作后可以得到知识。如2.5.2中的例子,猎人每次出门打猎时带了一把伞(D+ 遮雨(P= 猎人打猎时外面下雨(I),可以转换为知识规则:下雨需要带伞(K)。

    2.5.7 知识  数据

    知识转化为数据也可以通过两种方法实现。第一种即数据信息知识的逆过程,例如下雨需要带伞(K 猎人打猎时外面下雨(I 猎人出门打猎时带了一把伞(D)。第二种通过现有的知识来预测某实体的数据,例如根据某地的气候特征、季节等预测此地的温度数据。

    2.5.8 知识  信息

    知识可以直接转化为信息,也可以与已有信息结合转化为新的信息。例如已知五一假期人们的出行量将增加(K),可以直接预测五一人们大都会选择去外地旅游(I)。但若结合2020年新冠病毒疫情肆虐(I),可以得出2020年五一假期将不会有大量人选择去外地旅游(I)。

    2.5.8 知识  知识

    知识与知识之间的转化是最基本的一种转化,知识之间往往存在联系,知识与知识的组合可以生成新的知识。例如,已知人体每天需要摄入足够的蛋白质(K1 ),鸡蛋富含有丰富的蛋白质(K2),因此可以根据K1K2得到人们可以通过食用鸡蛋补充蛋白质(K3)。

    以上是数据、信息和知识之间所有可能的九种关系,实际过程中不一定所有的转化都会发生。数据、信息和知识以及下文要介绍的意图之间的关系如图1所示。

     

    2 数据、信息、知识和意图关系图


    3 意图体系

    3.1 意图体系介绍

    人类的一切行为都与动机相关,人在与机器交互时也不例外。所以,我们可以通过意图将不同实体联系起来,这样交互系统不仅可以以用户意图为驱动来进行交互,而且可以利用与请求交互的用户具有相同意图的数据、信息和知识来辅助交互过程,实现资源利用的最大化和交互效率。

    意图体系是一种不同层之间具有IS-A关系的,由各种不同的用户目的组成的树或图。意图体系中存储用户在什么条件下可能有什么意图、以及系统对该意图应该做出的操作。意图可以来源于用户的输入、对历史数据的学习、对用户意图的计算等。

    意图作为DIKW体系的补充,起到分解、简化意图,使得计算机可以理解意图并使得意图可计算的作用。可以在一定程度上解决信息定义,以及信息-知识、知识-智慧之间的断层问题。如果智慧视为智能数据处理过程,信息是被意图赋予了实际意义的数据,知识是从数据和信息中总结来的经验。意图作为DIKW体系的补充,在信息层和知识层、知识层和智慧层之间起到了桥梁的作用。

    意图驱动的DIKW体系中,意图体系和DIKW体系将互相补充,DIKW体系解决了以图形式表示的意图体系不足以表示完整意图的问题,意图体系完善了DIKW体系的定义和DIKW体系内部不同层次间的转化与关系。

    3.2 意图体系(P)的构建

    本文中的意图体系使用有向图来描述用户意图: 图的各个边代表包括拓展、概率分布、ANDOREQUAL的各类关系描述不同意图间的关系。如果仅仅考虑拓展和概率分布关系,此图将退化为森林(树的集合),其中的所有叶子节点即原子意图,原子意图经过多种形式的组合后即可描述用户实际意图。综上,可对意图体系作如下定义:

    1)意图模型是一张有向图,其节点间包含以下关系:

    a. 层与层之间:拓展关系,概率分布

    b. 同层之间:ANDOR关系

    其节点拥有以下必要的属性:

    a. 意图名称

    b. 父亲节点

    c. 子节点

    2)构建方法:

    Step 1: 根据知识按层进行意图分解,产生包含若干棵树的意图森林;

    Step 2:根据知识对意图森林各个节点进行分析,标定各个分叉的概率分布;

    Step 3:根据知识补充意图森林中各个节点间的关系,此时意图森林变为意图图示。

    意图体系如图2所示:

     

    2 意图体系示意图


    4. 意图驱动与意图计算

    4.1 意图驱动

    交互软件在过去几十年里发展迅速。由于早期的软件系统通常在一个领域中解决小问题,所以程序员的大部分时间都是用来使算法在内存和处理约束中高效运行的[7]。因此,设计的抽象级别不远高于代码的抽象级别。随着处理速度和内存大小的增加,对运行在这些机器上的软件的期望也随之增加。具体来说,用户现在期望他们的系统“智能”足以适应正在解决的问题和系统执行的环境[8]。为了满足这些期望,软件设计者试图利用来自涵盖多个领域的各种资源的信息来模拟人类解决问题的能力。虽然这种方法已经产生了越来越强大的智能交互系统,但系统复杂性急剧增加,使得更难理解、分析和构建此类系统[9]

    意图驱动将用户与系统交互的意图作为目标[10],可以通过分解意图来降低意图复杂性,并以意图为驱动构建能够更容易适应需求变化的系统。意图描述了为什么需要某个特定交互任务。因此,意图是构建能够适应各种情况的系统的关键,包括环境的变化、系统组件能力的变化以及待解决问题的变化。在分布式系统中,通常情况下,多个不同的系统组件可以执行多个任务[11]。只有知道任务需要执行的目标(或原因),系统才能智能地选择在哪个组件上执行哪个任务[12]

    4.2 意图计算

    在智能交互系统中,计算机如何更快捷、精确地理解用户的目的可以减少交互的障碍和提高交互效率,因此这是我们需要重点考虑的问题之一,这要求系统能使计算机一定程度上计算用户意图。意图计算的意义在于结合多方位的数据估计用户的真实意图为系统决策做支撑[13]。拥有相同意图的不同用户可能拥有不同的行为(即输入),不同用户的相同的行为(输入)也可能对应该用户不同的意图。这个问题的难点在于:

    1)用户行为的输入可能是多样且可扩展的,而计算机可以存储的信息的形式是有限的,我们需要一个可扩展、有效且高效的模型来适应可能输入的多维度的数据;

    2)因为针对相同输入,随着使用系统的主体的变化,系统可能存在不同而输出,故需要对使用系统的主体建模;

    针对难点(1),通过上文构建的意图驱动的DIKW体系可以有效解决,难点(2)可通过将用户DIKW化,将系统拥有的用户的数据构建为DIKW和意图体系以便更新和计算。因此,意图计算的输入为用户的DIKW体系意图体系和用户所对应用户群体的DIKW和意图体系,输出是系统对用户当前意图的预测,以按发生概率降序排列的列表表示。综上,意图计算总体可以分为以下流程:

    Step 1 用户画像的获取/用户DIKW和意图体系的构建;

    Step 2 用户所对应用户群体的获取/用户所对应用户群体DIKW和意图体系的构建;

    Step 3 输入决策信息到用户画像,输出用户原子意图;

    Step 4 根据用户画像和原子意图,在意图图示中由底向上推测用户实际意图;

    Step 5 由推测的用户实际意图和用户画像,在意图图示中自顶向下输出用户实际意图对应的全部原子意图;

    Step 6 系统将原子意图翻译为实际业务逻辑并输出或执行;

    Step 7 根据用户反馈调整用户画像和意图体系;

    在实际流程中,还会包括意图分解、意图体系节点构造、读取意图体系中用户意图路径等在整个过程中,穿插执行。意图计算流程图如3所示:

     

    3 意图计算流程图


    5. 实例分析——智能交互开关照明系统

    5.1 需求分析

    在当今人们的生活中,酒店、餐厅等一些需要用到开关、按键等设施来控制照明的场景中,用户需要记忆多个开关、按钮的功能,并依据自己的需求使用合适的开关或按钮。然而当前的常规开关在这些场景下,用户需要付出一定的记忆成本和尝试成本。例如人们在住酒店时,往往不熟悉环境,无法清楚的知道每个开关所控制的灯光,尤其在深夜,人们需要尝试几次来打开自己想要打开的灯,这极大地增加了不方便性。如果照明系统能智能地根据用户的历史数据和捕捉到的动作、活动、声音、传感信号等预测用户的意图来动态编辑开关的功能或者自动执行开关灯动作,将很大程度上解决上述问题,不仅使用户与系统的交互过程无感、无压且更加方便,也可以作为酒店、食堂等商业场所的一大亮点吸引客户,增加收益。

    5.2 概要设计

    5.2.1 基本处理流程

    智能交互开关照明系统基于前文所述的意图驱动的跨DIKW模态方法实现,其本质是按键功能决策系统。整个系统可以看作一个虚拟社区,虚拟社区中的对象均以DIKW-P体系形式存储和维护,并在DIKW-P体系层面进行相关运算来为用户提供服务。系统输入为通过传感器等设备检测到的用户动作、活动和时间等多维度的数据;系统输出为合适的交互方案。总体流程为:

    (1) 系统初始化:系统以问卷或开发者构建的方式,获取与照明问题相关的基础数据并建立系统的数据体系、信息体系、知识体系和意图库。

    (2) 用户画像获取:根据用户的输入数据,构建用户的数据体系、信息体系、知识体系和意图体系。

    (3) 决策:输入模块收到用户请求,输入模块发送当前用户的DIKW-P体系给决策模型并发起决策请求;决策模块结合输入模块传来的当前用户的DIKW-P体系,获得用户可能的全部意图并分析每一个可能的意图发生的可能性并以意图价值的形式量化可能性,最后以价值降序输出意图列表。

    (4) 输出:输出模块结合决策模块传出的意图列表,规划用户交互逻辑。

    智能交互开关照明系统总体流程图如4所示:

     

    4 智能交互开关照明系统流程图

    5.2.2 模块划分

    根据智能交互开关照明系统的总体流程,整个系统可以划分为:系统初始化模块、输入模块、决策模块和输出模块。系统模块划分图如5所示,各个模块的详细介绍如下:

    (1) 系统初始化模块详细设计

    ①模块功能:根据虚拟社区内已有和交互产生的数据更新和维护系统的DIKW-P体系。

    ②用途:系统初始化模块通过接收输入模块处理过的用户画像(即用户的DIKW-P体系)来更新和维护系统的DIKW-P体系以及虚拟社区。这样整个虚拟社区的知识库会不断完善,为决策结果的准确度提供支持。

    ③构建方式:

    初次使用时,系统通过网络搜索、开发人员的输入来构建最初系统的DIKW-P体系;

    每次交互后,初始化模块接收输入模块处理过的用户画像加入到虚拟社区,并分别标记其中可以代表此用户特征的数据、信息、知识、意图。

     

    2)输入模块详细设计

    ①模块功能:根据输入的多模态数据产生用户画像。

    ②用途:输入模块通过对输入的多模态数据进行预处理,生成用户画像,即用户的DIKW-P体系。用户画像可以很好的反映用户的特点,以供决策模块使用。

    ③构建方式:

    Step 1 初始化:系统以问卷或请求输入的形式,获取用户的部分信息作为初始数据并以此构建初始用户画像(DIKW-P体系);

    Step 2 对永久数据的自学习:系统将用户的历史数据作为附加信息加入用户画像中以完善用户画像;

    Step 3 对临时数据的自学习:系统从检测到的用户行为和用户画像的冲突中检查可能的临时数据,在确认是临时数据后对当前模型快照并将临时数据加入用户画像。在临时数据过期后,系统自动从快照将用户画像恢复到未引入临时数据的状态,并引入之后加入的永久数据到用户画像中;

    Step 4 将当前用户的用户画像(DIKW-P体系)传回系统初始化模块以便系统更新。

    ④附加信息:

    为降低系统各个模块耦合性,所有数据输入、预处理相关操作均在本模块完成;用户与系统的交互实际发生在用户和本模块之间;本模块作为其他模块的控制器而存在;

    3)决策模块详细设计

    ①模块功能:决策出交互方案。

    ②用途:决策模型根据用户画像(DIKW-P体系)、实时数据,对解空间树进行剪枝,并输出可能的交互方案;

    ③构建方式:决策模块使用用户画像推断用户可能的意图,对意图体系进行剪枝;然后决策模型以一定的规则赋予意图模型中不同意图一定的价值(价值来自事件细分),并将结果交给输出模块。

    ④附加信息:

    本模块是系统核心,它接受输入模块指令并对意图模型做出操作;本模块不涉及任何和用户交互,所有的交互操作(包括用户结果反馈)都应在输入模块实现。

    4)输出模块详细设计

    ①模块功能:根据经过决策模块剪枝后的意图体系输出决策结果。

    ③构建方式:使用输入模块维护的用户画像产出本次交互的意图体系,本次交互的意图体系反应用户在特定条件下的特定行为代表的意图,并将意图和系统对此意图应做出的反应绑定起来。

    ④附加信息:

    本模块是系统输出单元,决策模块和用户画像中的抽象用户意图将在本模块被具象化为系统对用户意图的反馈;本模块不涉及任何与用户直接交互,所有的交互操作(包括用户结果反馈)都应在输入模块实现;本模块是系统输出信息的唯一接口,包括决策结果输出在内的所有输出操作均在本模块实现。

     

    5 智能交互开关照明系统模块划分图

    5.2.3 异常处理和反馈机制

    由于本系统不是每一次交互都会获取完整的、有效的数据来支撑系统来运算出交互逻辑,因此可能会存在诸如决策模块未能准确地计算出用户的交互意图异常的情况。故智能照明系统需要一个异常处理机制,通过接收用户反馈来纠错。异常处理和反馈机制可通过以下步骤实现:

    Step 1 输入模块收到用户反馈决策不符合实际意图,输入模块请求输出模块,检查用户实际请求是否出现在本次决策的意图列表;

    Step 1-1 是,输入模块调整用户画像中与用户实际请求相关的数据;

    Step 1-2 否,输入模块询问本次的意图是否是临时性的意图和相应的时效数据;

    Step 1-2-1 是,用户将用户临时意图和时效数据组合加入DIKW-P体系;

    Step 1-2-2 否,用户将用户的意图加入DIKW-P体系;

    Step 2 系统重新学习,并更新用户画像交由决策模块计算,输出模块重新输出结果。

    5.3 系统处理流程演示

    本节将以酒店房间照明问题为案例来演示系统的处理流程。假定有如下场景:用户A于中午1200时在酒店注册房间,准备观看于凌晨200直播的欧冠决赛足球赛。当天是周内,用户A1430打开台灯在书桌前接打电话、处理邮件等,在下午1900时打开了房间主照明灯并用晚餐。凌晨130打开卫生间灯去卫生间洗澡后打开了电视机等待比赛开始。

    下文将以此为例演示智能照明系统处理流程。

    5.3.1 构建DIKW-P体系

    Step 1:由原始数据,实例化出实体A,创建本次交互的用户画像(即ADIKW-P体系)并将对应的全部数据对应到实体下,如图6所示。

     

    6 数据体系的构建

    Step 2:识别用户A的意图并分解用户意图,标注意图之间的关系创建意图体系并加入用户的DIKW-P体系中,此例中意图“办公”可以分解为“接打电话”和“处理邮件”两个子意图,意图“使用卫生间”可以分解为“洗澡”和“上厕所”两个子意图,意图“吃晚饭”是原子意图不可分解则直接与相应的数据关联。如图7所示。

     

    7 意图体系的构建

    Step 3:根据意图体系和数据体系构建信息体系并加入用户的DIKW-P体系中。根据前文中的转化关系和公式Data + Purpose = Information。由数据“1430打开台灯”及其对应意图体系,得到信息“用户A在下午工作”;由数据“1900打开主照明灯”及其对应意图体系,得到信息“1900天已经变黑”;由数据“130打开卫生间灯”及其对应意图体系,得到信息“用户A凌晨未入睡或起夜”。如图8所示。

     

    8 信息体系的构建

    Step 4:获取相关知识构建知识体系并加入用户的DIKW-P体系中,如图9所示。

     

    9 知识体系的构建

    5.3.2 系统运行逻辑

    在交互时,此智能开关照明系统会首先通过系统配套的嵌入式设备或传感器识别用户的相关动作、活动、声音等数据触发交互,然后利用系统中虚拟社区内的DIKW-P体系构建用户的DIKW-P体系。首先进行意图计算预测用户这些原子意图对应的实际意图。除了如上图所示的意图体系中的节点外,实际运行过程中,意图体系会在构建过程中将进一步分解为原子意图,以便系统识别并以此为桩节点自底向上进行意图计算,最终获得用户的实际意图并执行相应操作。以用户A为例,在完成如5.3.1节中所示DIKW-P体系构建后,如果系统在凌晨130检测到用户起床动作,则可以将起床作为原子意图计算用户A的实际意图是使用卫生间,系统可自动为用户A打开卫生间灯或将用户床头的开关全部设置为打开卫生间灯等操作。

    5.4 功能描述

    智能交互开关照明系统的为用户提供的主要功能可以简要分为可编辑面板和智能助理两部分。介绍如下:

    5.4.1 可编辑面板

    可编辑面板意为房间内的所有开关的功能均不是固定的,开关所控制的灯源可以动态变化,主要通过以下方式实现:

    (1)个性化定制:用户可以通过设置调整开关面板交互方式和功能为用户个性化预设方案。例如用户有起夜的习惯,因此用户可以在睡前将开关面板的所有按键均设置为打开卫生间灯,这样在夜间只要能接触到开关即可,不需要考虑开关控制的是不是卫生间灯。如图10所示。

     

     

    10 可编辑开关示意图

     

    2)用户意图预测:系统可自动根据虚拟社区内的用户画像及历史数据,通过系统决策模块输出符合用户习惯的交互方案,将开关各个按键的功能、按键大小等调整为最优的组合方式以便用户使用。

     

    5.4.2 智能助理

    智能交互的开关系统内置一个智能助理,为用户提供帮助。智能助理可以提供以下服务:

    (1) 在每次执行方案前,告知用户系统预测的意图和即将进行的操作,获取用户反馈并调整当前意图序列,将最优方案设为最高优先度反馈给用户。

    (2) 在执行决策结果对应的操作前:在执行预测的用户意图对应的操作时,智能助理可根据时间、天气等将灯光强度调整为适宜的大小。例如在深夜去卫生间,灯光强度应比白天低;阴天时主照明灯的打开时间应该比晴朗时提前等。

    (3) 打开灯光使用过程中:根据用户与灯光距离、角度、使用时间等参数,计算调整灯光照射角度、强度、色调等。

    (4) 自动报警:检测到用户行为异常、火灾等情况时,智能助理可以自动报警。

    5.5 隐私保护问题

    随着边缘计算、大数据以及物联网技术的普及和嵌入式设备的大量应用产生了大量数据设计隐私问题[14]。本文中提到的系统同样由于需要采集用户的大量数据来保障系统运行,因此对这些数据的保护也显得尤为重要,我们必须考虑用户的隐私保护问题。在意图驱动的跨DIKW模态智能交互方法中,用户数据被作为类型化资源,表示为隐式形式[15],是数据、信息、知识和智慧以及意图结构中的一系列关系,这样可以在一定程度上实现脱敏以保护用户隐私。


    6. 总结

    本文描述了一种意图驱动的跨DIKW模态智能交互方法,可以适应不同类型智能体、嵌入式设备等需要人机交互的场景,并通过智能开关照明系统的实例演示了此方法。随着人工智能技术和智能设备的普及,人类日常生活的网络化产生了大量的交互数据资源,对这些多模态资源进行整合和处理是必然趋势。我们迫切需要一种高效、通用的方法将这些资源表示为一种相对统一的形式。此方法将交互产生的各种离散的、多模态的数据资源分解为数据、信息、知识、智慧体系,不仅有利于管理和使用,而且提高了计算机处理这些资源的高效性和统一性。此外,由于意图体系的引入,可以将相同实体的数据和信息之间联系起来,并且将不同实体通过意图联系起来,达到资源共享、互用的目的,避免资源浪费。因此,以意图为驱动的交互方法可以在某个实体的数据不完整的情况下借用具有相同意图的实体的DIKW和意图体系完成交互处理。

    由于自身知识的局限和时间原因,本文描述的方法不可避免地存在一些缺点和不足,在今后的学习和研究中,我将继续改进和完善。


    致谢

    行文至此,预示着我四年的本科学习即将结束。回首四年的生活,有庆幸小成功时的喜悦、有因为失败的悲伤、有与同学相处的快乐、也有在篮球场上尽情挥洒汗水的酣畅淋漓。时间如白驹过隙,四年来,遗憾与收获并存、迷茫与希望犹在。转眼就要离开海南大学风景如画四季如夏的校园、学识渊博的各位老师和朝夕相处的同学,心里更多的是感激。

    首先要感谢段玉聪老师对我的指导。在大学的最后一年,我有幸加入了段老师的课题组,并在此收获颇丰。段老师知识渊博、平易近人,教给我的不仅是学术上的知识,更多的还有做人和生活的哲理,这些都让我更加明确自己的目标。在选题时,段老师充分尊重我的意见,为我提供了全方位的支持,才让我的毕业论文最终成型。同时,也感谢在我本科四年中所有对我有过指导和帮助的老师们,你们的教诲将是我前进路上最宝贵的财富之一。

    感谢父母和家人对我二十多年来的大力支持。父母生我养我,不教我受冻挨饿,不教我受人欺辱,让我有书读,有健全的人格,尊重我的每一个决定,培养我的独立意识。爷爷奶奶疼我爱我,每周雷打不动地打电话关心我,时常嘘寒问暖,使我常常感受到他们的爱。从小一起长大的两位姐姐,我们关系亲密,是我不如意时最好的倾听者,让我有勇气面对种种挑战。

    感谢一路上陪伴我的朋友们。感谢对我的包容与照顾,四年时间里一起学习、一起玩乐、一起开心又一起失落。虽然我们来自不同的地方,有不同的生活习惯,却都能以一颗赤诚之心对待彼此。愿你们前程似锦,永远是少年。

    至此停笔,奔向下一段旅程。古之立大事者,不惟有超世之才,亦必有坚忍不拔之志。未来如何不得而知,只希望自己能不忘初心,低头做事、抬头走路,继续完成自己学业的同时,肩负起应有的责任,做一个对国家、社会、家庭有用的人,哪怕只有一点。


    References:

    [1] Lamberti D M, Wallace W A. Intelligent Interface Design: An Empirical Assessment of Knowledge Presentation in Expert Systems[J]. Mis Quarterly, 1990, 14(3):279-311.

    [2] Chein M, Mugnier M L. Graph-based knowledge representation: computational foundations of conceptual graphs[M]. Springer Science & Business Media, 2008.

    [3] Gene Bellinger, Durval Castro, Anthony Mills. Data, Information, Knowledge, & Wisdom. www.systems-thinking.org/dikw/dikw.htm, 2004.

    [4]段玉聪, 邵礼旭, 曹步清,. 投入驱动的存储与计算一体化的事务处理效率优化方法[J]. 计算机工程与科学, 2018(8).

    [5] Duan Y ,  Shao L ,  Hu G , et al. Specifying architecture of knowledge graph with data graph, information graph, knowledge graph and wisdom graph[C]. IEEE International Conference on Software Engineering Research. IEEE, 2017.

    [6]雷羽潇,段玉聪.基于DIKW图谱的虚拟社区用户性格分类与转换方法[J].应用科学学报,2020,38(05):803-824.

    [7] Zickert, Frank, and Roman Beck. “Evaluation of the Goal-Oriented Requirements Engineering Method KAOS.” AMCIS. 2010.

    [8] Darimont, Robert, and Axel Van Lamsweerde. “Formal refinement patterns for goal-driven requirements elaboration.” ACM SIGSOFT Software Engineering Notes 21.6 (1996): 179-190.

    [9] Kruglanski, Arie W., and Ewa Szumowska. “Habitual behavior is goal-driven.” Perspectives on Psychological Science 15.5 (2020): 1256-1271.

    [10] DeLoach, Scott A., and Matthew Miller. “A goal model for adaptive complex systems.” Journal of Advance Computational Research 2.2 (2017).

    [11] Lee, Jonathan, and Nien-Lin Xue. “Analyzing user requirements by use cases: A goal-driven approach.” IEEE software 16.4 (1999): 92-101.

    [12] Darimont, Robert, et al. “GRAIL/KAOS: an environment for goal-driven requirements engineering.” Proceedings of the 19th international conference on Software engineering. 1997.

    [13] 段玉聪,方照霖,王兴斌. 意图驱动的面向本质计算的可编程智能控制方法和系统[P]. 海南省:CN112782982A, 2021-05-11.

    [14]段玉聪,张友良,白勇,曹春杰.类型化隐式资源的隐私保护方法[J].北京邮电大学学报,2019,42(04):121-125.

    [15]段玉聪,邵礼旭,崔立真,高洪皓.基于知识图谱的云端个性化测试推荐[J].小型微型计算机系统,2018,39(12):2743-2747.




    https://blog.sciencenet.cn/blog-3429562-1369234.html

    上一篇:DIKW主题的博士、硕士毕业论文高速增长,知网能检索到的16篇DIKW学位论文列表(宋正阳同学DIKWP团队)
    下一篇:意图驱动的智能调度DIKW算法设计(指导的2021年5月本科毕业论文)
    收藏 IP: 153.0.3.*| 热度|

    0

    该博文允许注册用户评论 请点击登录 评论 (0 个评论)

    数据加载中...

    Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

    GMT+8, 2024-5-4 16:30

    Powered by ScienceNet.cn

    Copyright © 2007- 中国科学报社

    返回顶部