博文

再读《追问人工智能》科研笔记三则

已有 1738 次阅读 2020-9-3 11:18 |个人分类:2020|系统分类:科研笔记

第一则：人机与推荐

何树浩

“想要预测一个人的未来，需要了解其过去“。推荐技术作为当今个性化时代互联网的核心技术之一，如何实现纯粹的个性化推荐，是推荐技术发展的重要方向之一。如何实现更加精准，更加高效的推荐，一直是谷歌、亚马逊、阿里巴巴等巨头公司重兵投入的领域之一，现如今的推荐的系统所处的环境是大数据量，显然更加适合数据驱动的方法，如何利用已有的数据，去实现推荐模型更加精确的推荐结果，是众多研究者所努力的方向2015年左右，深度学习的技术浪潮席卷而来，迅速引爆了整个领域的全面技术变革。

一、推荐系统的基本架构

当今时代是一个大数据时代，我们每个人都处于大量的数据之中，如何找到自己感兴趣的书籍、电影、论文等是我们常常遇见的难题。推荐系统要解决的就是如何在信息过载的情况下高效的获得感兴趣的信息。

推荐系统希望利用大量的与‘“人”相关的信息，比如历史行为信息，人口属性，关系网络，人所处的位置等。但是在一般的场景中，人们的选择会受到时间，地点，人的状态（比如：心情等）一系列环境信息或称为上下文信息的影响。

图1 推荐系统框架

直观来看，推荐系统是要处理的是“人”和“信息”之间的关系，其实推荐系统要处理的是人与人、人与环境的关系。人与物之间的关系，是西方一个重要的研究方向。推荐系统反馈给人几个推荐结果，然后人去选择自己最想要的，这就形成了一个简单的人机交互系统。但是在未来的人工智能中，人机融合的方式，既把人的智慧和机器的智能结合在一起，是一个更加有力的发展趋势。

二、是什么限制了推荐技术的发展

从2010年之前前篇一律的协同过滤（CollaborativeFiltering,CF）、逻辑回归，进化到因子分解机、梯度提升树，再到2015年后的深度学习时代，各种模型架构层出不穷。时至今日，深度学习推荐系统已经成为主流方法，与传统的机器学习模型相比，深度学习模型的表达能力更强，能够挖掘出更多数据中潜藏的模式。但是这种基于数据驱动的方式，天生就是有缺陷的。

首先是现有的推荐技术无法去理解人的动机性。在心理学上一般被认为涉及行为的发端、方向、强度和持续性。动机也是有层次的，不同层级可以互相转换。人处于不同的需求层次就会有不同的动机层次。有了动机后，人们的行为就有了指向性，这对于人的日常行为是非常重要的。但是现有的推荐系统无法去理解人的动机，而只是单纯的挖掘历史数据，去寻找一个最大的可能选项。如果让现有的推荐系统去产生动机，那么一大难点在于动机是很难被表征的。

其次是现有的推荐系统无法很好的利用人类的常识。常识的定义为在一定的文化背景下，人们拥有的相同的经验知识。比较常见的有空间、时间、文化、物理常识。常识对于我们日常生活十分重要，尤其是在我们做出决定与判断的时候尤为如此。很多常识是潜移默化形成的，是文化与背景学习的产物。

目前的推荐系统有两条方法来解决常识问题：

1.使用（类人）强化学习的方法，就像一个孩子一样去学习，不过这样时间成本比较大，用户能否承担起这些成本还是未知数。

2.建立大型的常识库，并将其存储到电脑中。现在比较前沿的方法就是将知识图谱和推荐系统进行结合，将常识嵌入到推荐系统中，实现一小部分的常识表征。

最后是推荐系统怎么去做最后的决策，选出最好的结果。人类的决策机制主要分为三大部分：理性决策、描述性决策与自然决策。理性决策即认为人在决策时遵循着理性价值最大化的原则，比较具有代表性的有冯·诺伊曼提出的最大期望效用理论。而描述性决策认为人在进行决策时不完全遵循理性准则。该理论认为，决策者依据价值函数、权重函数赋予选项不同的效用值，最终选取最大期望效用值做出决策。而自然决策专门研究人们如何在自然环境或仿真环境下实际进行决策。而现如今的推荐系统的决策方法往往是不完全的理性决策，为什么说不完全，因为我们所设计的价值期望，并不能代表人的价值，更不用说期望之后有多大的偏差了。

所以，我们要怎么去表征人的价值，怎么去建立事实与价值的之间的关系，显然，这是一个高度非线性的关系。只有更好的表征出价值与事实的关系，我们才能更好的去决策，更好的去选择出对的结果。

未来推荐系统的发展，一定要去理解人的动机，这样才能使得推荐更有导向，一定要去利用人类世界的常识，这样才能使得推荐系统从数据驱动实现的感知跨越到从数据驱动与知识驱动融合实现的认知层面。最后就是要去表征价值与事实之间的关系，我们拿到很多事实的数据，怎么去表征他和价值的关系，这样才能更好的去指导推荐系统的决策和选择，实现一个真正理解人的，千人前面的，精准、高效的推荐系统。

三、从知识和数据融合开始

随着目前大规模的数据交叉及相互关联性，数据的持征和现实的需求也都相应的发生了变化。大规模、跨领域、跨语言、跨媒体、普适化、动态演化、多源异构为主要特征的数据正在发挥着更加重要的作用。

目前还没有形成一个高效的用于知识融合的算法，现在己有的知识融合方法都是通过借鉴信息融合方法得来的。知识融合的目的是为了提供更好的知识，将多源异构的知识经过一系列处理，得到可靠性较高的知识，也可能会发现隐藏的知识。

知识融合最简单的形式就是将多源异构的知识进行组合，知识来源之间通过相互合作或相互竞争，将它们提供的知识部分或全部都融合在一起，形成新的知识。要实现知识融合至关重要的事情就是要设计有效的知识融合算法。数据融合是解决从不同的来源冲突的值。

尽管现在对知识库及知识融合方面现在己经有了大量的研究，对于知识库的研究大都是基于某一特定领域的，而对于知识融合的研究虽然取得了一定的成绩，但仍有非常大的的研究和进步空间。由于现在大数据技术不断的快速发展，知识具有了异构，多源，规模庞大等特点，同样给知识融合带来了巨大的挑战。

将知识和数据融合之后的结果，用于个性化推荐中，可以初步缓解常识应用在推荐系统之中的问题。使得机器可以像人一样拥有的类似的经验，使得推荐系统做出决定与判断的时候更加有理有据。

第二则：读《追问人工智能》有感

韩建雨

一、人机融合的优势与必然

1.人机融合

随着科技的发展，机器人的智能水平也得到极大的提高，但在现有技术水平下，机器的智能与决策能力还有一定局限性。同时机器智能水平越高，系统结构愈复杂，系统的可靠性和可维护性也逐步降低，在类似于星球探测的动态非结构化环境中，存在多种不确定性因素，为确保任务安全性，需要人和机器人密切合作，充分发挥人和机器人的优势，从而有效解决复杂环境和不确定性带来的风险问题。

作为人类赋予机器的一种特殊智力，机器智能擅长基于规则与逻辑推理。机器学习和人工智能技术为从数据中获取知识提供了有力工具，但是人可以对半结构，非结构化或不良结构问题进行处理，在很多领域有独特的优势。通过合理的任务划分和协作机制，两个主体可以相互配合，发挥两个主体各自的优势。

复合智能体现在人机协同过程中的多个方面。在输入端，不再单一地依赖于人的感知信息或者是机器人传感器的采集信息，而是两者有效地结合；在信息处理部分，可以融合人的认知与机器人的计算等优势，形成一种新的信息处理方式；在输出端，将人的价值效应引入机器人的迭代算法中，形成更为有效的判断。

人机融合智能不仅能自由的选择主体，还能适时地进行主体变换，在人-机-环境系统交互的过程中实现深度态势感知，有机地实现数学语言、自然语言、思维语言之间的能指、所指、意指切换，进而准确、快速的实现我们的意图和目的。人机融合智能既不同于人类的智能也不同于机器的智能，而是在人-机-环境系统交互中充分结合人和机的优势产生的一种新智能形式，是侧重于将人脖子以上的大脑与“电脑”相结合所产生的新型智能体。人的智能在于事前无数据，机器的智能体现在事后有数据，而数据的价值和意义则是由人来决定的，只有将人的认知与机器的计算结合起来才是未来智能领域发展的方向。

2.人机特性

人和机器目前都拥有“学习”的能力，不同的是人类在学习过程中学的不是知识，是获取数据、信息和知识经验的方法，而机器学习学的则是数据、信息和知识。机器的学习离不开时空与符号，而人的学习随着自身情感、价值、事实改变而不断发生变化；机器的学习遵循和依赖已有的规则，而人则是在学习中不断改变旧规则、打破常规则、建立新规则。

人类可以通过自己的常识来感知世界、理解世界，而典型的人工智能体则缺乏对物理世界运行的一般理解、对人类动机和行为的基本理解（如直觉心理学）和对普遍事物的认知。

二、人机协作模式

1.人机协同感知

机器主要感知信息的方式为视觉传感器，它通过深度相机一方面可以基于计算机视觉算法识别物体，另一方面可以判断物体的位置，但是以这种方式感知物体和目标有很大的局限性，比如环境中目标出现遮挡，机器识别算法依赖于先验，只能识别之前见过的物体等。而人则是对于某些物体赋予了特定的语义信息定目标，并且人具备丰富的经验，能够很好地处理上述情况。人可以通过语音等交互方式将目标物体的位置传递给机器，机器通过相关处理转换成坐标信息，直接确定物体位置，从而实现人机协同感知。

2.人机协同推理与决策

人在人机协同推理决策的过程中可以扮演决策判断的作用。机器可将自身决策信息反馈给人，当机器所选择的决策路径为最优最近决策时，可以将其作为最终决策，此时人不干预机器决策过程，由机器自主完成任务。当机器决策出现失误或者不确定时，人可以根据自身经验判断、当前环境特点以及机提供的决策依据，重新进行决策。

智能决策，一定是辅助，而不能代替人，机器可以事先编辑好作战预案，战时自动执行，必要时再进行人工干预。机器应该做的应是敌我识别及其它机器能做的部分，超出机决策域的部分机也应提供判据让人去做最后的抉择。

通过人机协同的密切程度可以将人机协同分为三种层次：低度协作、中度协作和高度协作。在极为复杂的场景和环境下，机器基本不参与感知和决策的过程（不适应环境），直接由人进行决策，这是人机的低度协同；在人机的中度协同情况下，大部分任务由机器来完成，人则是负责监督机器的工作，在发生特殊情况或环境发生改变的时候，人能够快速参与决策的过程；在高度协作模式中，人和机器共同感知、共同推理、共同决策，在此模式下，通过决策模型通过风险/代价评估等进行人机决策域划分。对于不同的场景，需要充分考虑任务特点与需求，选择合适的人机协同模式，才能在确保任务顺利完成的前提下，使人和机均能发挥各自最大的优势，提升任务完成的效率。

确定人机协同模式和方案之后，可以通过一些方案指标来判断是整体方案的选择是否合理，人机协同的结果是否符合预期，如：

决策的准确率：用决策方案的正确程度来衡量，准确率越高，说明做出的决策取得的效果越好，越符合我们预期的情况。不同类型、不同环境下的任务对于准确率有不同的要求，一般来说，准确率越高越好；

决策的反应时：即效率，由决策者完成决策的时间来衡量，做出决策所需时间越短，决策判断的效率就越高，反之则效率越低。不同的决策者针对不同类型的任务会表现出不同的效率，一般来讲，反应时越少越好。

决策者的负荷：指决策者在做出相关决策时的心理负荷、体力负荷的综合结果，任务难度越高、误决策代价越大，决策者的负荷程度越高，反之越低，不同的决策者、不同人之间由于心理承受能力的不同，面对同样任务时的心理负荷也不同。

第三则：数字化时代，机器如何利用默会知识助力人机融合？

陶雯轩

人机融合智能的关键点在于如何最大化人和机的优势以打造最高效的智能系统。其中，人和机器的关系就像两片不规则的拼图，人机融合智能要做的事情，就是考虑如何组装这两片拼图以让其得到特定场景下的全局最优解。人机融合智能是人的智能和机器智能取长补短的结果，其最终实现的是一个“1+1>2”的智能系统。要实现这样一个智能系统，最关键的一点就是加深人机之间的“互相理解”。相对于机器而言，人具有数据信息量小但对信息理解层次更深的特性，换句话说，当人和机器同时看到一条数据时，人相对机器理解更为深入，其处理结果也是不一致的。例：“今天降温了”，机器得到的信息是“日期 = 今天，温度 = 较低（概率 =0.8），变化参数 = 下降”，而人得到的信息往往是“今天是不是该穿件外套出门”“他说这句话是不是希望我关心一下他”...。以上场景在生活中随处可见，其关键点在于机器无法在人机协同过程中深入理解信息背后的含义。如果机器对数据的理解可以更靠近人的理解的话，那么这些问题就可以迎刃而解了。

一个解决这个问题的可能途径是，构建弹性知识库，让机器能更好的理解语言的内涵与外延，在机器和人协同的过程中，找到纳什均衡点。那么，一个问题来了，机器如何真正理解并掌握语言的“弹性”呢？解决这个问题的一个可能途径是通过机器可感知传播的暗知识链接人类的默会知识。

“默会知识（Tacit Knowledge）”（又称“缄默的知识”，又称“内隐的知识”），主要是相对于显性知识而言的。它是一种只可意会不可言传的知识，是一种经常使用却又不能通过语言文字符号予以清晰表达或直接传递的知识。如我们在做某事的行动中所拥有的知识，这种知识即是所谓的“行动中的知识”（knowledgein action），或者“内在于行动中的知识”（action-inherent knowledge）。它是波兰尼在1958年首先在其名著《个体知识》中提出的。绝大部分知识无法用语言表达，如骑马、打铁、骑自行车、琴棋书画，察言观色、待人接物、判断机会和危险等。这些知识由于无法记录，所以无法传播和积累，更无法被集中。英籍犹太裔科学家、哲学家波兰尼(Michael Polyani,1891-1976)称这些知识为"默会知识"或者"默知识"。其范例体现了智力的各种机能，它本质上是一种理解力、领悟力、判断力。比如，眼光、鉴别力、趣味、技巧、创造力等。默会知识具有以下特点：（1）镶嵌于实践活动之中，非命题和语言所能尽，只能在行动中展现、被觉察、被意会。（2）不能以正规的形式加以传递，只能通过学徒制传递。（3）不易大规模积累、储藏和传播。（4）不能加以批判性反思（也有人不同意这一看法，认为默会知识虽然是无法言传的，但却是可以意会的，可意会意味着可提取、可反思、可交流）。（5）默会知识相对于明确知识具有逻辑上的在先性与根源性。

知识按照可否表征、可否感受可以分为：明知识（可感受可表达，如：牛顿定律、浮力定律；不可感受可表达，如集合论、量子力学）、默知识（可感受不可表达，如：骑车、绘画）、暗知识（不可感受不可表达，如：潜意识）。暗知识就是那些既无法被人类感受又不能表达出来的知识。也就是说人类本身无法理解和掌握这些知识。但这些知识却潜藏在人脑之中，被外化为经验习惯得到传承。与人无法理解暗知识相反的是，这些知识在机器中却很容易得到传播，其表现形式类似AlphaGo Zero里面的“神经网络”的全部参数。对于暗知识而言，人类的知识如果不可陈述则不可记录和传播。但机器发掘出来的知识即使无法陈述和理解也可以记录并能在机器间传播。这些暗知识的表现方式就是一堆看似随机的数字。

显性知识（可表征）和隐性知识（不可表征）相互转化，形成共同化、表出化、联结化、内在化。其中共同化强调的是体验，比如师傅手把手教徒弟，徒弟观察学习的体验过程。知识从师傅脑子里暗默知识，转义到徒弟脑子里的暗默知识；表出化强调的是通过某种信息媒介，把暗默知识转化为形式知识。比如通过图文的方式，但是，就不可避免的会出现表达误差。内在化强调的是把形式知识转化为自己的暗默知识，比如看书，看文章的过程；联结化强调的是把形式知识和形式知识联结起来，做一些的整合，产生更优的形式知识，也就是暗知识。

机器通过对数据的深度态势感知，可以得到联结化的形式知识，即暗知识。通过对暗知识的场景化，可以得到人机融合智能系统所需的默会知识。当人和机器对数据理解层次同步，甚至机器对数据理解深于人时，能实现更高效的协同，打造更智能的人机系统。

无人系统里仍然存在着一个无实体形态的人

转载本文请联系原作者获取授权，同时请注明本文来自刘伟科学网博客。
链接地址：https://blog.sciencenet.cn/blog-40841-1249099.html

上一篇：魔术之间：自变量与因变量的交互
下一篇：怎么看国内外人工智能公司的发展趋势？

收藏 IP: 124.64.123.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

刘伟

扫一扫，分享此博文

twhlw的个人博客分享 http://blog.sciencenet.cn/u/twhlw

博文

再读《追问人工智能》科研笔记三则

一、人机融合的优势与必然

二、人机协作模式

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

刘伟

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

twhlw的个人博客分享 http://blog.sciencenet.cn/u/twhlw

博文

再读《追问人工智能》科研笔记三则

一、人机融合的优势与必然

二、人机协作模式

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

刘伟

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)