twhlw的个人博客分享 http://blog.sciencenet.cn/u/twhlw

博文

人机融合智能的难点 精选

已有 3600 次阅读 2020-3-16 23:29 |个人分类:2020|系统分类:科研笔记

【编者按:近来陆续接到不少朋友的来信,普遍反映:“能否多研究一下算法或工程应用,抽象的概念、理论用处不大!”对此,笔者甚是担忧,这种实用主义思想好听了说是一种近视的观点,不好听的说就是一种得过且过的应付。没有深入的思考和本质的探索,是不可能“领跑”和“领先”的,无源之水,无本之末终究难成大器。其实,相比定量应用过程而言,定性分析方向更为重要,它不但决定未来走势,它还涉及现在超越。下面文字尽管有些杂乱,依然努力尝试描述一些人机智能融合方向的难点和瓶颈,争取为正确的定量应用做个铺垫吧!】


我小时候读过很多科幻小说。其中一个最常见的主题是“人与机器”,它经常以机器人的形式变得自我意识和威胁人类。这一主题也成为了《终结者》和《黑客帝国》等好莱坞电影的主要内容……“


                                               ----比尔.盖茨


051322hxmrr9qm6mme8m9g.jpg

 

人工智能并不创造新事物,它只能执行我们本身了解如何去做的事情。当前,随着人工智能越来越不能满足人们的期望和胃口,人机交互所带来的智能融合渐渐走上了前台。但是,无论国内外的军用还是民用,人机融合智能都还差强人意,那么,人机融合智能的难点究竟在什么地方呢?

众所周知,智能不是大脑的产物,而是人机环境系统交互的生态产物,既包括客观的数据,也包括主观的信息和知识,如果说“美”是主客观结合的产物,那么智能也应该是主客观融合的结果。其中包括各种的高、中、低元素,是一种既开放又封闭、既弥散又聚合的动态组织体系架构。智能是围绕价值、意义而衍生出来的,是由事实所触发的价值而生成的,数据是一种相对的客观存在,只有被价值化成信息后才可能被凝炼出相关情境下的知识,并进而同化顺应出许多能够解决实际困难的适应方法和有效手段。与人工智能不同的是,真实的智能一般不是情境的,也不是场景的,而是环境的,更准确地说人机环境的“可久可大”,情境和场景相对比较小而且穿透性较差,很难产生出满意解和最优解,这也是为什么人工智能会有意外出现且不好解释的原因:不会主动刻画场景和情境之外的事、物,现在人工智能的基本思路都是训练一堆算法,然后各自绑定场景。其实,单纯用数据、信息、知识都是很难驱动出真实的智能的,智能是一种简单的适应性变化从“是”到“应”(休谟之问)。人产生出的智能常常是情智(算计),机产生出的往往是理智(计算),人机融合生成的智能一般包括是情智+理智,是一种特殊的计算+算计(简化为:计算计)。从某种意义上说,人工智能是一种事实智能,而人类智能则是一种价值智慧。当然,事实有不同程度的事实,价值也有不同程度的价值。真实往往是程度不同的事实与大小不同的价值混合而成。绝大多数偶然性事实的降临常常来自非情境、非场景和非逻辑的价值穿越。

人之所以能够把握方向,原因在于透析事实之后的动态价值,能够确定一个事物、事实在特定情境任务下的主观价值而不仅仅是客观显著性,所以是有机的,机器没有主观,则不然,是没有价值与风险责任的计算过程,是无机的。就像平常的二选一,在关键时刻常常重如泰山,所以仅有价值还不够,还需要承担后果的勇气和胆量。主观判断和情感价值至关重要,所以交战开火的最终决定权不能交给机器。任何一个事物或事实都有多面性,简化而言,不妨称之为两面性,是和非,或者1和0,但这一事物/事实会随着关联的发展而发生价值性的变化,或快或慢,或短或长,人类的作用就是恰如其分地把这事物/事实的价值性与客观发展状态同步嵌入、与势具进,而不是像机器一样刻舟求剑式地打标签。更有意思的是,事物/事实的这种两面性(或多面性)带有天然的自反性,而且在特定的任务情境下会被触发实施,是会变成非,0会生出1,这也是不确定性产生的根源之一。人有自我本我超我,不断强化主观偏好(自我),而机器没有自我本我超我之分,总是相对客观地感知世界,人自然不能与机器容易地达成共识。同样对于一个事物或事实,机器的标签不会个性化弹性的变化,更不会延展成长变化,而人会。机器的数据信息知识标签不会生长,而人类的数据信息知识概念却会变化,如一寸光阴一寸金中的一和寸是可变的,执子之手与子偕老也与本意大相径庭。人是很复杂的,机器却使之简单化,一旦标签,从此固定,没有随机应变,没有是非之心。人可以让数据不枯燥的方法就是赋予价值形成信息,如315打假日,23乔丹,658小区公交;让信息不乏味的手段就是凝炼出意义生成知识,如1+1=2,一寸光阴一寸金;让知识不萎靡的途径就是演化为生生不息的智能……

经典物理中的光子有波粒二象性,量子物理中的量子既有叠加态又有纠缠态;生理中的DNA是由两条反向平行的多核苷酸链相互缠绕形成一个双螺旋结构;心理中的事实与价值这两条关系链路也是一种虚实二象、叠加、纠缠、螺旋结构吧!所有的类比都有着某种“神性”的表象穿透和本质涌现,物理、生理、心理的这种类比也不意外,仔细想想,智能实质上就是心理(意识)、生理(神经)、物理(环境)三者之间的相互影响相互作用之产物,简单称之为人物(机)环境系统。一般而言,人工智能就是用符号/行为/联结主义进行客观事实的形式化表征、推理和计算,很少涉及价值性、责任性因果关系判断和决策,而深度态势感知中的深度就是指事实、价值与责任的融合(也即实与虚的互补)。态、势涉及客观事实性的数据及信息/知识中的客观部分(如突显性、时、空参数等),简单称之为事实链,而感、知涉及主观价值性的参数部分(如期望、努力程度等),不妨称之为价值链,深度态势感知就是由事实链与价值链交织纠缠在一起的“双螺旋”结构,进而能够实现有效的判断和准确的决策功能。另外,人侧重于主观价值把控算计,机偏向客观事实过程计算,也是一种“双螺旋”结构。如何实现这两种“双螺旋”结构之间“碱基对(时空)”的恰当匹配,仍将是各国都没有解决的难题,那么如何表征这些参数?如何搭建起这个模型呢?心理学家卡尼曼(Kahneman)认为,人有两个自我:经验自我和记忆自我,经验自我负责动作和决策,记忆自我负责解读反思。同样,人有两个智能:事实智能和价值智能,事实智能负责客观和理性,价值智能负责主观和感性。简言之,真正的智能,不会发生在你的手机里,而是存在于你的生活中……

人会活学活用,是活智活能,充满了易和辩证!既合又分,既弥又聚,具体情况具体分析,何时何处何方式统筹兼顾!也许人智能中的表征不需要完美的定义就行,如白马非马(在输入端,白马非马是一个事实:白马确实不是马;白马非马也不是一个事实:白马确实也是马,这是一个价值问题。白马非马是人类智能的一个重要表征,它反映了机器智能很难表征的一种表征:事实自反性表征。),里面可以有事实、价值和责任,抑或其中的不同组合变化,而机器只有数据、公式,并且机器没有目的,人的所有行为都是有目的的,这个目的性就是价值/责任,目的性可以分为远中近,价值程度也有大中小,甚至责任也有大中小,人的自主和否定常常涉及责任和价值,而不仅仅限于事实。更进一步说,一个概念可以有三个坐标轴判定,一个是事实轴,涉及时、空、属性、物理、逻辑等客观现实方面,一个价值轴,涉及个性化的心理、艺术、关系、伦理、非逻辑等主观可能方面,一个责任轴,涉及共性化的心理、艺术、关系、伦理、非逻辑等主观可能方面。其内涵外延常常在这三个坐标轴决定的坐标系中变化弥聚,从而构成了璀璨多彩的智能世界和眼花缭乱的意(向)形(式)情境。

分类是人类认识世界的一种基本方法。对事物的划分,是概念发生的起点,是一切思维的前提。科学技术体系的建立,就是从分类这个起点开始建立起来的。但大家只重视事实分类,而忽略了价值和责任分类,尤其是三者的混合分类。概念除了能指、所指外,还有一种动指,即一种随机动态不确定的指向,就像小孩子说的那样“冰激凌的心情”、“不高兴的高兴”,随时可以让概念间的界限变得可有可无,并且可以任意穿越。

《易》即辩证法:知几(苗头、兆头)即普遍联系,趣(抓住时机)即对立统一,变通(随机应变)即变化发展。道是西方的自然秩序。真实交互中,常常会有状态碰撞、趋势碰撞、感觉碰撞、知觉碰撞发生,对于人机融合智能的深度态势感知而言,态、势、感、知、事实和价值、责任是动态联系在一起的。从观察表征、调整推理到判断决策、实施行动各个阶段,人的智能里面不但充斥着反事实性,还混合了不少的反价值性、反责任性,同时人的类比可以解决机器解决不了的各种非映射关系。在深度态势感知中,势就是方向和速度,方向更为重要;态就是程度和大小,程度稍微领先;知就是本质和联系,本质尤为突出;感就是现象和属性,现象大于属性;深度就是人机环境的融合和交互,融合在一起的交互。态势感知的困难在于态、势的混杂性与感、知的混杂性,更困难的是态、势、感、知的混杂性。有真有假,还有真假,有虚有实,还有虚实……评价深度态势感知好坏的标准之一就是做人、机、环、态、势、感、知辅助线的能力,做的好,迎刃而解,做不好,南辕北辙。

人机之间,自主智能与它主智能之间的区别表面上是同化与顺应,实际上是同化与顺应的转换程度和效率。自主性简单地说就是“应该”,侧重于是一个价值性的问题。皮亚杰研究儿童心理学时认为,孩子的发展是与外界环境相互作用下不断发生的。孩子的发展不是简单的外界不断刺激的过程,它必须凭借孩子现有的内部结构。孩子的活动与外部的刺激具有同等重要的地位。随着儿童年龄的增长,其认知发展涉及到图式、同化、顺应和平衡四个关键词。

儿童的图式、同化、顺应和平衡一开始是基于客观事实的,例如生理需求的吃喝拉撒眠等;随着不断的成长,逐渐形成了价值性的图式、同化、顺应和平衡,例如爱恨情仇虑等;再后来,又衍生出责任性的图式、同化、顺应和平衡,例如礼义廉耻勇等。

1、同化:是指学习个体对刺激输入的过滤或改变过程。也就是说个体在感受刺激时,把它们纳入头脑中原有的图式之内,使其成为自身的一部分,以加强和丰富主体的动作。

例:原来我会用锅煮鱼肉,需要20分钟。现在买了牛肉,我自然想到用锅煮,如果成功了,就是技能同化了。

2、顺应:是指外部环境发生变化,而原有认知结构无法同化新环境提供的信息时所引起的儿童认知结构发生重组与改造的过程,即个体的认知结构因外部刺激的影响而发生改变的过程。就是个体改变自己的动作以适应客观变化。

例:现在市场上没有肉,只有菜,我也用20分钟来煮,菜熟透,吃完口感不好。于是,只好煮了10分钟。因为我顺应了菜的加工方式。

3、平衡:是指学习者个体通过自我调节机制,不断地通过同化与顺应两种方式,使认知发展从一个平衡状态向另一个平衡状态过渡的过程。

例:原来会煮肉,是平衡的状态。突然出现了菜,从不会加工,到能成功吃上菜,又到了一个新的平衡状态。而这个过程,就是平衡的过程。

4、图式:是一种结构和组织,它们在相同或类似的环境中,会由于重复而引起迁移或概括。最初的基本能力来自先天的遗传,以后在适应环境的过程中,不断变化、丰富和发展,形成了本质不同的认知图式(结构)。例:肉和菜我都会煮了,也会煮小米粥了,我根据经验还出版了一本《舌尖上的中国》的美食食谱。

这是一个互相影响的、不断变化的发展过程。孩子和新人机系统的发展是充斥着同化、顺应,再达到平衡,就是图式体系不断改变和发展的过程。

人机之间也是如此。即使是刚出生的婴儿和新人机系统,也有自己简单的图式系统。我们不能忽略孩子或人机原有的图式系统,而一味地强调外在的环境让孩子学习。

只有让孩子和新人机系统自己去亲身体验,强调孩子和新人机系统自己的动作运动和活动才会有效果。比如自己抓取物体等动作。只有当孩子和新人机系统凭借现有的结构,即图式体系,即孩子和新人机系统的动作——不断地抓取物体才能引起改变,达到同化的过程。

在此基础上,孩子和新人机系统更可能去拿其他的物体进行尝试,这是同化的泛化。而孩子自身内部结构也因为这个过程发生了改变,以适应现实,就是顺应。

DARPA的“深绿(Deep Green)”指控系统在这方面做的就不好,所以没有得到期望的应用效果。整个系统所揭示的人机融合智能和态势感知机理相对模糊、机制较为混乱,由此而产生的智能只描述了事实性计算,缺失了人的情感性、价值性和责任性,人、机系统的同化、顺应不平衡,人机图式体系不断改变发展的方向和过程不一致。

任何人机系统不协调的实质问题在于如何把握“变”和“好”,而不是“快”和“演”。否则人不是人,机不是机,环境不是环境,各自的优点都没有发挥出来,该变的时候不变,不该变的时候乱变……,另外人机融合的方式、时机、功能等应该是恰如其分的“好”,不早不晚、不快不慢,才能发挥出各自的优点,实现最优匹配,在开放的真实环境下,由此而产生的智能程度和主动效力才能最大。

人机融合智能现在的一个趋势就是软件硬件化,硬件软件化,机件人性化,人不断地机械化,其实这不一定是一个好的现象,人应该做人的事情,机做机的事情。它的融合的核心在这儿强调一句话,就是所有的人机融合里面一定要有范围,任何智能都不是任何地方,任何时间多么智能,它都有局限性,包括人本身也是,人本身都有局限性,所以怎样找到那个范围非常重要(遍历当前的诸多学科,很难令人相信利用已有的数理、物理、生理、心理、管理……能够研究好人机融合智能中的“恰好”。)。

在自然科学中,人们常用数学方程式来描述一些现象。若以时间(T)作为变量,认知操作x的变化即等于当时机体的状态(S)和外界的刺激(R)的函数。S指的是机体的生理心理状态,大脑里的存储等。当外界刺激作用处于某种特定状态的机体时便产生结果,发生变化,即:

T—T+I,        ^ x=f(S,R)

认知科学认为:计算机的工作原理也是一样的,在规定的时间里,计算机存储的记忆相当于机体的状态;计算机输入相当于给机体施加的某种刺激。当给计算机某种输入时计算机便进行操作,其内部发生变化,从而得到结果。计算机的操作过程可以看作是每一个单位时间内其状态的变化。可以用计算机程序模拟人的策略水平,用计算机语言模拟人的初级信息加工过程,用计算机硬件模拟人的生理过程(中枢神经系统、神经元、大脑的活动)。

事实上,人的心理结构与生理、物理结构是不同的,它不但受自于机体本身,同时又是适应环境的结果。故,在T—T+I, ^ x=f(S,R)中,^x=f(S,R)中的人与机的R不同,人的R不但涉及外界刺激r,还有内在刺激r',所以是^x=f(S,r,r',r"),在深度态势感知的算计+计算系统中,外界刺激r可以看作内态刺激,内在刺激r'可以看作内态刺激,内在刺激r”可以看作势刺激。也许,感可以看作态刺激,知可以看作势刺激。

当前,人机融合智能化平台,人在环是必须的,人在环中就是一个系统的直接部分,既监又控;人在环上就是一个系统的间接部分,主监管控;人在环外的智能系统已算失控。如何研究人机环境系统并使之工程化呢?首先要研究人,包括人的感和知;其次,要研究机以及如何把这些感知功能迁移到机器(装备)和机制(管理)中去;再次,要研究环境,包括在各种环境中所产生出的状态和趋势(简称为态势);对这三者的研究不一定是顺序的,也可以倒序、插序、混序、融序等等,以前主要研究人的态势感知能力,现在随着人工智能技术的发展,又开始研究机器(装备)和机制(管理)的态势感知功能,未来的发展趋势是研究两者如何实现结合的问题,既人机融合智能中的深度态势感知问题,这也是研究人在环的关键问题。

就像人们认识世界往往从巫术、神话开始一样,认知科学一开始也是从一个“错误”的类比开始的:计算机根本上就不像人。所谓符号就是模式(pattern),任何一个模式,只要它能和其它模式相区别,它就是一个符号。计算机,无论是电子的还是量子的,都是人为定义且达成共识的“物理符号系统”,即其强调所研究的对象是一个具体的物质系统。而对于人类而言,其研究和运用的是一个弹性且个性化的“心理符号系统”,其强调所研究的对象是一个抽象的价值意义系统。

对于学习而言,人们常常误以为人的学习是规范规则化的学习,其实这是一个误区,人类真正的学习不完全是整体性系统性展开的,而是学习过程中渗透了大量的个性化灵活性的隐喻和类比,把一些零散破碎的其它有关/无关知识、方法巧妙地贯穿粘合起那些所谓的标准化知识学习过程中,结果是,教育家们自觉不自觉地运用倒序的方式告诉学生们,本学科及其书本上的知识是系统的完整的,那些获取这些系统知识之发现过程后面的隐性认识方法却被忽略省却了……而这些未被说明的部分恰恰就是真正的学习,同时也是机器学习所无法企及的部分。相比之下,人类的学习可能是无表征或弱表征学习——一种理解性学习,而机器学习是一种“非理解性”表征学习。学习可以使人更好、更坦然地升维处理未知,但对机却不尽然。人的学习中除了态(如动作序列、文字数字多少等)外还有势(发展变化趋势),具有俯视的连锁效应;机器学习中无论是深度学习、强化学习还是其它学习,都少了从势到态的凌驾,只有从态到势的亦步亦趋,其中少了许多试探性的刺激—选择—调整。对人的学习而言,即使对同一概念的表示(用词)往往有不同的主观和客观成分,如何能尽量达成共识。这也许涉及事实与价值的比例问题。人际交流的语言是能指与所指混合的复合双向通道,而目前的人机交互只能指向单一通道,这就导致了当前的智能传播还没有出现弦外之音和言外之意。也许在不远的未来,人机智能传播会在能指和所指之间形成一种“能所+所指”的折中交互方式,以利于联系人与机的智能传播体系发展。机器学习常常有名无实,而人可以有名有实,还可以无名有实、无名无实。打破事实时空域的是价值域,引导价值域走势的责任性,进而形成了一条区别、比例、决策链。人的智慧表现在:动态的表征+动态的推理+动态的规划+动态的实施,其中的动态既基于事实和价值,也基于责任和义务。机的智能则不然。

未来智能平台的快速发展面临的一个关键是人机环境系统的协调发展,这里的“人”涉及设计者、制造者、管理者、营销者、消费者、维护者等;这里的“机”不但是指智能装备中的软件、硬件,还将涉及产业链中各环节之间衔接的机制机理;这里的“环境”涉及诸多领域的“政用产学研商”合作协同环境;通过人、机、环境三者之间态、势、感、知的相互作用,实现精准发力、数据整合等新型AI+的应用。所以:


研究复杂最好从简单开始,
研究事实最好从价值开始,
研究群体最好从单一开始,
研究组织最好从网络开始,
……
研究表征最好从弥聚开始,
研究决策最好从个性开始,
研究人机最好从边界开始,
研究未知最好从已知开始,
研究模型最好从类比开始,
研究内容最好从形式开始,
研究意识最好从物质开始,
……
研究智能最好从区分开始,
研究指挥最好从控制开始,
研究算法最好从数据开始

研究开始最好从结束开始,

……


反之,也成立



如何实现人机融合智能中深度态势感知功能与能力的有机结合程度是衡量该系统好坏的主要指标。能力主要是产生意图,功能侧重于实现意图,一个主动,一个被动。意图不是靠(拍)脑门产生出来的,是人机环境相互交互涌现出来的,所以这是一个既“复”又“杂”的复杂性问题,也许会涉及到分工与协同的一些基本问题。研究复杂性问题最好的办法就是从简单出发,比如研究人、机的“学习”,最好就是从娃娃抓起,孩子们学习语言比较快,除了大脑发育的原因,另外一个重要的可能是TA们所有的概念、知识形成与客观事实形象等有关,无论东西,天地纵横,无法无天,想的很少,稀有琢磨、不管因果、无缘无故就形成了价值意义,比较容易形成指数级连锁反应,孩子们这种“主动犯错误”的方式,也许是获得创造性思维能力的一个重要途径;而成人学语言困难出来大脑发育之外,往往从价值意义到客观事实形象有关等,社会习俗,个人习惯,环境约束,边界条件,瞻前顾后、左思右想、不敢不愿不应犯错误的这种先入为主的因果方式往往制约着各种关联级索的爆发涌现。

人机融合在本质上是事实与价值变动的一种形式与方法,它不仅从来不是、而且永远不可能是静止不变的。借用生物学上的一个术语,可把人机融合过程的“不断从内部革新工效结构,即不断地破坏旧的和不断创造新的结构”这种过程,称作为“结构突变”。人类的模式识别与机器的模式识别根本不同,人的模式不仅是状态上的,而且是趋势性的“得意忘形”。如果说,机器的模式识别是事实性的实构体,那么人类的模式识别则是事实性与价值性混合的虚实体。

那么如何建立起研发者、使用者与系统之间的信任关系将会变得越来越重要,目前人机融合的解决办法有两个:第一个是让人参与到系统的训练过程中(这里涉及到人何时、何地、何方式有效参与到系统中的问题),第二点是尽可能的多分配决策的任务给人来完成(这里涉及到如何筛选出适合人的决策任务及其防止“投射效应”程度的问题)。尽管已经有人做过实验证明了这两点可以增加人对机器/系统的信任程度,但该结论是否具有广泛性?需要更深入分析和研究。


mmexport1565970688761.jpg


人的智表现在:动态的表征+动态的推理+动态的规划+动态的实施



https://blog.sciencenet.cn/blog-40841-1223865.html

上一篇:2019年人工智能研发热点回眸
下一篇:算法的秘密
收藏 IP: 124.64.125.*| 热度|

3 杨正瓴 黄永义 王兴

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 09:28

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部