||
摘要:大多数智能生命都具备在紧急情况下的急智反应能力,它的获得与智能生命身上遍布的“传感器”密不可分。那么,什么是急智智能呢?它对人工智能的发展有何启示呢?
70年代末,有位生于山东的著名歌手,名叫张帝。他的唱歌风格与众不同,特别善长根据歌曲的旋律,临时即兴填词来演唱。最著名的一首即兴填词歌曲是在印度尼西亚创作的、介绍人体传感器的《毛毛歌》。他也因为演唱这类诙谐幽默、即兴创作的歌,被誉为急智歌王。
不仅人类的歌唱中能看到急智,大多数智能生命都具备在紧急情况下的急智反应能力。不同的是,这种能力是因为生存而非娱乐需要演化出来的,它的获得与智能生命身上遍布的“传感器”密不可分。这些举两个有趣的例子。
苍蝇是我们最熟悉不过的昆虫,它的急智反应能力非常强,这一点在我们举起苍蝇拍的时候应该能强烈感受到。很多情况下,在你挥动拍子的一瞬间,它就已经感应到了危险的来临,快速使出乾坤大挪移,蝇出生天了。这里帮助它形成急智反应的功臣之一是其身上的传感器。首先是它的视觉感应器。苍蝇的眼睛是复眼,组成复眼的每只小眼睛只有不到1度的感受野,但因为眼睛多,所以苍蝇每天醒来一睁眼,就有着全景天窗无死角观赏世界的愉快心情,也能轻松应付来自眼睛后方的威胁。其次,是它的后翅退化而成的平衡棒,可以帮助它随意调整飞行的方向和角度,甚至快速倒着向后飞行也毫无困难。除此以外,苍蝇身上密布的能感受气流变化的绒毛,能迅速检测到苍蝇拍的运动。结合这些传感器的信息,以及头部顶端用于定位的传感器,苍蝇便能从中获得极为丰富的数据。结果,尽管它大脑里与飞行相关的神经元数量不足千个,却可以利用丰富的传感器来增广信息的广度,以少量的计算,通过反馈和控制形成急智反应。
图1:苍蝇复眼
除了苍蝇,猫的急智反应也值得说一说。人们都说猫有九条命,其原因当然不是说它真能多次死而复生,而是指其从高空下落时有神奇的翻转身体至腿部落地的能力,以至于网上流传着用黄油面包放猫背上即可制作永动机的笑梗。除此以外,猫的反应速度也非常快。我记得我小的时候,家里养的猫经常会叼回老鼠和不知名的飞禽回来,估计想着为家里做点力所能及的“贡献”。为什么猫会有那么快的反应速度呢?究其原因,一是视觉的超能力。猫的瞳孔能随光线放大缩小,白天一线天,晚上夜明珠,ISO感光度一流。而其动态视觉能力让其可以把很多看上去快的动作如老鼠的逃逸分解成若干组慢动作,从而能更好地把握出击时间。二是听觉超能力。猫的听力远甚于人类,其耳朵神经约4万束,人类仅1万束。而且猫的耳朵还能转向和单独运动,帮助聚集声音。相比之下,人类只有极其少数的人还保有动耳朵的能力。三是猫的胡子。它是猫感知近处目标的触觉传感器,而且猫咪的胡须根部还有感知敏锐的神经,能够检测周边风向和气压变化,并根据空气的振动来估计猎物的大小。所以,千万不能随意剪掉或剃掉,否则猫都有可能站不稳。四是猫毛。遇见紧急情况时,它还容易奓毛,即猫毛底端连着的、皮肤里的小毛囊肌肉会下意识缩紧,使得猫全身的毛瞬间竖起来。这种应急反应可以让猫看上去比平时大不少,起到恐吓的作用。当然,猫毛还承担了人猫间情感的传递。如果你逆着猫毛的方向撸猫,很有可能会让宠物猫不开心。
图2 猫
图3:猫与黄油面包
图4 柠猫的空中旋转
类似地,人类皮肤上的“传感器”也不少。比如毛发,虽然人类在进化中,已经谜一般地褪去了身上浓密的毛衣,但残存的毛发仍然在帮助我们感受外界的温度、气流、湿度等的变化,甚至警示蚊虫的叮咬。其它毛发感应的功能则大相径庭,如头发能起到了遮阳的作用,但对于长期待在室内的码农或追求跑步速度的跑步爱好者,似乎就没那么多的重要性;耳朵里的毛细胞能帮助人类辨别不同频率的声音,在音源分离中著名的鸡尾酒会问题的研究就与之密切相关。鼻毛除了能遮挡灰尘、保持进入鼻腔的空气足够湿润和不太冷外,还会帮着维护嗅神经闻出各种气味的能力。据说,鼻毛剪得过多,有导致嗅觉失灵的风险。而眉毛的功能是为了防止水进入眼睛,睫毛则能防止飞尘和小飞虫对眼睛的侵袭。这些“传感器”都或多或少帮助人类形成了一定的应急反应。
类似的传感器与应急反应,在智能生命还有挺多。一个共同的特点是传感器的数量和种类都比较多,并能利用丰富传感器收集的信息,通过简单计算,归类成易于辨识的事件并快速形成反应。
相比而说,目前人工智能中比较重要且热门的分支,深度学习,似乎较少考虑在前端做太多处理。反而更像是,用巧妇可为无米之炊的想法来做人工智能相关的各种任务。夸张点说,深度学习就是“给我一个烂摊子,我也能收拾好”。没数据,我自己生产;没特征,我深度生成;没分辨能力,我加各种关注和损失函数;把特征学习和预测集成到一个网络里学习的、端到端思路基本把“无米”后端的问题解决了不少,却没怎么考虑去额外多买些不同的米。当然,其中的原因部分与我们比较关注学术研究的进展有关。其结果是,我们常基于输入特征固定的数据集来评估算法的性能。尽管它提供了公平的算法比较环境,但却使得我们难以引入多变的输入特征。
在传感器设计方面,我们构造“丰富传感器”的能力这块仍有不少短板,它多少限制了人工智能产生急智反应或发展出急智智能。以自动驾驶为例,性能较好的往往依赖于昂贵的激光雷达,同时辅助以视觉感知的摄像头、夜视能力强的红外探测仪,通过回声定位目标和测距的超声波传感器以及毫米波传感器。然而,最为精确的激光雷达容易因路面的颠簸而损坏,其它传感器也均存在各自的短板。尤其在室外复杂环境行驶时,这些传感器提供的信息以及后端的处理能力均难以提供万无一失的紧急反应驾驶能力。如最近一次特斯拉事故则是因为无法区分天空与侧翻在高速路面的货车颜色所致。而某些期望仅采用视觉传感器来作自动驾驶的核心,很有可能忽略了一个事实,即人类在驾驶中的应急反应所依赖的传感器远不止视觉一个通道。而理解这些依赖传感器的急智智能也许通向L4以上级别自动驾驶的关键。
图5 谷歌无人驾驶汽车
比如在高速公路行车,当雨天高速经过积水路面时,车辆会发生侧滑。有经验的驾驶员能通过方向盘上获得的触感以及身体产生的轻微平衡来快速形成驾驶决策;比如车辆偏离高速道路或误入应急车道时,轮胎与路面的摩擦系数突然增加产生的声音异常变化,也会提醒驾驶员及时调整方向,防止车辆失控。除了驾驶,人类还有很多与身体传感器相关的急智智能,这里就不一一赘述。但不管是哪种,都说明传感器的意义之大。这与现有的深度学习盛行通过后端多层特征抽取、并依赖计算能力来弥补输入特征不足的大框架是不太一样的。
值得指出的是,也并非没有科研工作者考虑传感器端的问题。比如《新一代人工智能发展规划》中就提出了“智能前置”的概念,即将智能计算与传感器合二为一,使其能在传感器端就能对某些信息进行相关的计算和处理。类似地,2000年左右曾一度流行的压缩传感也考虑了传感器端。该理论考虑到自然界中相邻位置的信息具有强相关性,因此,香农第一采样定理中二倍频采样才能还原信息的假设就不必遵循了,而期望能利用压缩传感技术来将传感器端感知的冗余大幅度去除,从而减少或避免信源传输需要考虑的压缩和信宿接收时的解压缩。而在机械臂仿生设计研究中,也有不少与传感器设计相关的研究,如手指上的触觉。
显然,急智智能与智能体身上的各种传感器是密切相关的。同时,人与动物在传感器的形式、功能上也有不少差异。另外,我们也不难看出,在传感器方面,人类并不比其它智能生命多多少,甚至有些还有明显的退化。那么,人类为何还能在智能和食物链上凌驾于其它动物呢?
张军平
2020年10月14日
图片来源:
1. 苍蝇复眼
https://kuaibao.qq.com/s/20200108A043WC00?refer=spider
2. 猫与黄油地址:
https://www.sohu.com/a/206958505_643852
3. 柠猫动图地址:
https://tech.sina.com.cn/d/a/2016-05-13/doc-ifxsenvm0354164.shtml
4. 谷歌无人驾驶汽车:
http://www.cheyun.com/content/1563
往期文章阅读:
1. 人工智能的尽头是人工?
张军平,复旦大学计算机科学技术学院,教授、博士生导师,中国自动化学会混合智能专委会副主任。主要研究方向包括人工智能、机器学习、图像处理、生物认证及智能交通。至今发表论文近100篇,其中IEEE Transactions系列20余篇,包括IEEE TPAMI, TNNLS, ToC, TITS, TAC, TIP等。学术谷歌引用4000余次,H指数32。
出版科普著作《爱犯错的智能体》,曾连续24次推荐至科学网头条,2019年获得中国自动化学会科普奖。关于人工智能发展趋势的观点曾被《国家治理》周刊、《瞭望》、《科技日报》、《中国科学报》等媒体多次报道。连载的《读研秘技》至今被科学网推荐头条24次。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-28 18:21
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社