||
这双鞋有色差,左边的比右边深一点,你难道没发现吗?我仔细看了半天,愣是没看出差别!不过,我还是陪着她就鞋子的色差一起去店老板那理论了一番,虽然心里有点虚。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
颜色感知是视觉的基本功能之一,也是智能的基本元素之一。可是,颜色从何而来呢?为什么会有这些功能呢?它又是如何被认知的呢?
一、颜色的来源
众所周知,自然界中充斥着电磁波。按波长由短到长来划分,电磁波包括了伽马射线、X射线、紫外线、可见光、红外线、无线电波等。与整个电磁波谱近10的16次方级差的波长范围相比,可见光只分布在380nm(纳米)到760nm之间,简直是太宅了(窄)。而偏偏是这段窄得不能再窄的波谱,对人类的生存和智能发展却起了重要作用。为什么人类没有选择其它更宽的波谱来形成颜色视觉呢?
��
图1 左:电磁波谱与可见光; 右:电磁波在进入地球大气后的分布
一种可能的解释是,虽然自然界的电磁波分布广泛,但由于大气的保护作用,如臭氧层吸收掉了大量对大多数生物有害的紫外线、大气中的二氧化碳吸收掉了大量的远红外线、水蒸气吸收了近红外和微波,最终能进入地球大气层并到达地面的太阳辐射便以可见光谱范围为主,如图1右所示。而人类在演化中就选择了能量最强的这段光谱来感知世界,所谓之人择原理。然而,同样是电磁波,只是波长频率上的不同,为什么只有可见光能呈现颜色呢?
事实上这样说也不是完全精准, 因为不同物种感知电磁波的能力是不同的,感受的颜色也有细微差异。比如蜜蜂。据说由于复眼的原因,蜜蜂能感受更短波长即紫外线段 的差异。结果,在蜜蜂的眼里,白色的花可能会有不同的颜色。这方便了蜜蜂识别不同类型的白花,如图2所示。而众说周知的响尾蛇则能通过位于眼睛和鼻孔之间的 “热眼”感应到更长波段的红外线的强度变化,以此来区分活体与非活体。
�
��
�图2 人与蜜蜂视觉的差异[1]; 下图:人眼中的白花(左)与蜜蜂眼中的白花(右) [2]
不同于这两种动物,人类的颜色视觉感知范围都在380nm到760nm之间。按波长长短,粗分成了如彩虹的“红橙黄绿蓝靛紫”的颜色变化。国际照明协会也给出了无法通过其他颜色混合而成的相加三基色,即红、绿、蓝的波长定义,尽管每个基色实际都有一定的变化范围。考虑到打印、油画的颜色是通过反射获得的,它还给出了相减三基色,即青色、品红、黄色的定义。
��
图3 相加三基色与相减三基色
不管如何定义,人类对颜色的感知方式基本是一致的。目前公认的是杨一赫姆霍兹(Young-Helmholtz)三原色学说,即认为视觉系统中存在对红、绿、蓝三基色光线特别敏感的3种视锥细胞、或相应的3种感光色素。其它颜色的光线则作用于这三种视锥细胞并进行混色,并形成相应颜色的感觉。该学说解释了混色现象的原因,但还不能满意的说明色盲、补色现象、负后像等现象。类似的学说还有,也无法形成圆满解答。另外,视觉神经元对三基色的感知的敏感差异也基本相同。如主要负责蓝色感知的视蓝素,虽然总量少,但却最为敏感。因为存在这些一致性, 颜色感知才能有利于人类形成对世界大抵相同的观点、对物体的共同印象和概念、对情绪和心理的共同感受。
二、颜色的功能和错觉
如果人类只能感受光线的强弱,而无法感知颜色,那必然会少了不少能力和乐趣 。因为有了颜色的感知,于是在智能发展上便有了很大的提升。
第一个重要的提升是对目标识别能力的改善。随手拍张照片,如果换成黑白色,就会丢失不少结构信息,甚至彩色图像可能反映出来的深度信息也会损失不少。这是光强与颜色差异的区别。不仅如此,从视神经元的感受能力也能发现巨大的差异。人对光强度的分辨能力一般在20个灰度级左右,但对颜色的分辨却能上好几次数量级。这无形中拉大的目标或物体之间的区分度,为人类提高和加速识别目标提供了有利条件。
人类也把这一技术挪到计算机上用于其他任务的识别。如 AlphaGo直接把围棋的棋盘视为颜色在棋盘上的分布,并根据分布来判断每一个棋局的输赢。人类还把这一技术用到原本不可见的光谱上,如机场的X光机,帮助更有效地分辨危险物品。甚至将用于声波反射构成的医疗图像,如给B超图像着色,以提高医疗诊断的有效性。
值得指出的是,颜色分辨能力在男女之间有着明显的差别。男性对颜色的敏感程度,从平均意义来讲,要远低于女性。打个不恰当、夸张的比方,男性能认全彩虹里的“红橙黄绿蓝靛紫”就不错了,女性却可能认识上千种颜色。不信的话,女性同胞们可以把图4中不同种类的口红颜色让男性朋友辨别下。
��
图4 不同种类的口红
不过颜色认得少也不见得全是坏事,比如怕“鬼”的多是女性,有可能就跟颜色看得太多、容易产生的联想更丰富有关。为什么要在智能体上形成性别差异如此明显的颜色感知呢?难道是有助于提升智能体的情感交互?
有一点可以肯定的是,颜色确实会影响人类情感的表达。不然,买那么多种口红就没意义了。颜色有的时候还可以帮助掩饰真实情感,如用艳丽的口红来掩饰不愉快的心情。不同的色彩也能影响人对观察到的事件的判断,甚至给出截然相反的结论,如图5的着色。
�
图5 颜色错觉:救人还是?
图6 颜色影响图像的格调 (注:来自影像视觉杂志)
除此以外,颜色对于图像高层语义的表达也很重要。在摄影作品中,有时为了追求特殊的美感,会有意将照片的颜色退去,以形成所谓的高调、低调的黑白照片。但在多数情况下,彩色照片仍然占主导地位。在彩色图像上同一场景颜色明暗的变化会导致不同的感受,如图6。该图只是在颜色的明暗上做了些微变化,就影响了对图像中人物心情是忧郁还是略显阳光的判断。
另外,现有的与人工智能相关的诸多应用,都会或多或少考虑对颜色的处理。如图像修复(Image Inpainting)中,需要考虑缺失部分与未缺失图像之间的颜色一致性;图像标注(Image Captioning)任务需要考虑颜色带来的意境。
值得指出的是,古往今来的文人墨客从不吝啬用笔墨来描绘五彩斑斓的颜色。举例来说,鲁迅在《野草》中就有一句对寒冬时节花草颜色的描述:
雪野中有血红的宝珠山茶,白中隐青的单瓣梅花,深黄的磬口的蜡梅花;雪下面还有冷绿的杂草。
聊聊数笔,一幅有颜色的画面便跃然纸上。试想,如果没有颜色的细分,只有光的强度变化,由智能体、人类撰写的文学作品肯定会逊色不少 。
三、抽象颜色的认知
既然颜色在智能体中起了如此广泛、重要的作用,颜色的辨识又是在何时被固化到人的视觉中枢呢?
要回答这一问题,还可以先问另一个问题。有多少人去观察过儿童的发育,观察过儿童在不同年龄阶段对物体、概念的学习能力呢?
本人曾对某儿童的成长进行过长时间的观察。从我个人的经验来看,颜色是儿童在1岁以后才能学会和理解的。有别于有形物体的学习,颜色在早期发育中是比较难以学好的概念,因为它是触不到,摸不到的。
在儿童最初的物体学习阶段,触摸很重要。因为即使是同样的物体,如果不去触摸,人也会因因观察角度、透视角的不同,对物体产生不同的视觉感知。通过触摸,可以消歧,得到对物体更全面的了解和形成唯一的概念标签。
然而,颜色却是无法触摸的。在父母通过听觉系统向小孩传授这一概念的时候,儿童只能依赖视觉获取的信息来推测。但听觉信息传授的概念具有很强的多义性,比如说一堵墙是红色的。小朋友在无法触摸颜色时,即使父母通过手势来辅助传授,他/她也并不会清楚红色是特指什么,尤其在他/她习惯了通过触摸来帮助学习物体的时候。
通过观察颜色的传授过程,我发现:与有形物体相比,颜色尽管能够看到,要给其贴上的标签如红色、绿色等却是相对抽象的、略为高级的语义概念。结果,这个抽象的颜色,儿童需要花比学习有形物体更长的时间来理解,才能形成准确的抽象概念表征。同时,抽象的概念也使得颜色的认知往往会滞后于实体目标的学习。
��
图7 不同色盲的颜色感知
所以,颜色虽然是与生俱来的,但最终还要通过传授完成标定,并形成认知上的统一。然而,值得注意的是,这种认知上的统一,并不能解决因为基因或其他原因引起的色盲,甚至可能导致危险。比如我们常见的红色/绿色色盲患者,其在颜色的感知上对红色与绿色是没有区分的,如图7所示。但是,这并不意味着他/她在熟悉的场所会因为区分不了这两种颜色而出问题。因为,在儿童期的颜色学习时,父母会通过听觉和手势来帮助区分颜色会处的位置。比如红绿灯。尽管颜色感知相似,但在交通灯的位置往往是不同且相对固定的。所以,在熟悉地段,红/绿色盲患者是能正常生活的。但危险来自于,去陌生地方的时候。如果红绿灯位置产生变化,那红/绿色盲患者就会有潜在的危险。除此以外,这类患者在理解艺术作品中的情绪、美感上也可能会产生严重的偏差。当然,如近视眼创造的印象派一样,也不排除色盲患者会画出不同于常人、别具一格的杰作。
从颜色的传授还能看到,人对颜色甚至知识的学习似乎是从具体到抽象逐渐过渡的,而不会一开始就接触非常抽象的概念。如果想建构一个拟人的智能体,是否也应该遵循这一规范呢?是否不应该从相对于视觉更为抽象的自然语言处理开始着手呢?
而作为人工智能的研究者和爱好者,不妨也尝试观察下,自己的小孩什么时候能学会判断颜色和其他抽象概念。是否比学习实体的概念更困难? 观察新生儿的发育过程,尤其是0-3岁时期的,应该能对人的智能发育形成更直接、一手的了解。如果多些人去尝试,也许能得到很多统计意义上的、关于智能的新发现。
参考文献:
1. Sharla Riddle. How Bees See and Why It Matters. May 20, 2016. https://www.beeculture.com/bees-see-matters/
2. Michael Hanlon. A Bees-eye View: How Insects See Flowers Very Differently To Us. August 8, 2007.
平猫
2018年10月7日
�
延伸阅读:
11. 爱犯错的智能体--视觉篇(八):由粗到细、大范围优先的视觉
张军平,复旦大学计算机科学技术学院,教授、博士生导师,中国自动化学会混合智能专委会副主任。主要研究方向包括人工智能、机器学习、图像处理、生物认证及智能交通。至今发表论文近100篇,其中IEEE Transactions系列18篇,包括IEEE TPAMI, TNNLS, ToC, TITS, TAC等。学术谷歌引用2700余次,ESI高被引一篇,H指数27.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 11:04
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社