||
凌晨一点多,又度过了节奏明快、高强度工作的一天。熄灭灯,安静地躺到床上,闭上眼睛,调整下呼吸。没几分钟,一阵熟悉的感觉袭来,身体开始向大脑发出睡眠的信息。那感觉,就象是舞台上的灯光在谢幕后一排一排地关闭,躯体表层的感官细胞似乎也如潮水退去般逐层在“停止”它们的功能。很快,与床垫的接触感消失了,身体的沉重感无踪了,随之而来地是下坠感,身体一直往下坠。好在不会像第一次出现时那么惊慌失措,我甚至有些享受这种急速下坠体验,因为我已经能控制身体的姿态。我也知道再坚持一会,就能旋转着穿越一条长长的、漆黑的隧道,跃入繁星点点的天空,自由、缓慢地飞行了。
这是我偶尔能在快要入睡时,零距离观察自己做梦的体验。对于梦呢,历史上有各种各样的诠释。早期文明认为梦是人类能进入另一个真实的、物理世界的唯一通道。现代理论则一直在争论做梦的意义,有认为其只是生理机制,也有认为它是心理必需,或是两者的组合。著名的奥地利心理学家西格蒙德·弗洛伊德对自己的梦进行过近两年的自我分析,从压抑和性的角度出发,于1900年出版了经典名著《梦的解析》。曾与他合作、后又分道扬镳的瑞士心理学家卡尔·古斯塔夫·荣格在其自传《荣格自传:回忆、梦与省思》中也对梦给予了不同视角的分析[1]。咱古代也有一本居家旅行必备、民间流传甚广、靠梦来卜吉凶的《周公解梦》。而汉语成语对梦有更简洁的解释:“日有所思,夜有所梦”。 梦在《周礼·春官》中还被分成了六种类型:正梦、噩梦、思梦、寝梦、喜梦和惧梦。多数书中对梦的分析集中在精神层面、因果分析或心理治疗上。但是, 睡眠、梦对智能体的学习有何作用或启示呢?
一、睡眠周期
睡眠对智能体来说,是必不可少的休息方式。在睡眠期间,智能体会降低对外界刺激的反应和与周边环境的交互,相对抑制感知系统的活动以及所有随意肌(voluntary muscle)的活动,利用这段时间对全身各种系统进行保养调整。由于不用进行剧烈运动,能耗的需求也降低了。但能耗并非没有,如八小时睡眠后人的体重可能轻个7至8两甚至更多,所以,充分睡眠是有助于减肥的。
智能体在睡眠时的活动,没有日常生活时激烈,但也不象昏迷或其他有意识障碍方面的疾病那么缺乏活力。根据眼动的频率,睡眠可以区分成非快速眼动相睡眠(Non-Rapid Eye Movement,简称NREM)和快速眼动相睡眠(Rapid Eye Movement,简称REM)两个明显不同的模式。据说NERM睡眠能改进记忆能力,而REM可以增强创新性的问题求解能力。正常情况下,成年人会先进入NREM,才转到REM,平均时间约90分钟。再重复这一睡眠周期,一次良好的睡眠约有4-6个周期。对于NREM,美国睡眠医药协会还将其细分成3个小的阶段,因此一个睡眠周期包括五个阶段,N1->N2->N3->N2->REM [2],其中N3被称为delta睡眠或慢波(slow-wave)睡眠,而在自然醒阶段REM的比例会增加。前四个阶段的次序有时会出现变化,如图1。但如果先出现REM,再有NREM,那可能就是身体过于疲劳了。
图1 五阶段的睡眠周期示例 [3]
值得一提的是,虽然大部分的梦发生在REM阶段[4],近年来的研究表明,梦也会在其他阶段发生,只是频率要少得多。梦境多是以第一人称的形式出现,并会伴有各种“感觉”,如视觉和移动。目前最主要的做梦理论之一是John Allan Hobson和Robert McCarley在1973年提出的激活-合成假想(activation-synthesis hypothesis)理论[2,3]。该理论认为梦是在REM阶段,由大脑皮层中神经元的随机触发引起,然后前脑再创建一个故事来将这些无意义、荒谬的传感信息融合并使之有意义。这一理论解释了许多梦的古怪本质,但也只能解释梦的部分现象。据不完全统计,人的一生平均有六年的时间会用来做梦。那是否可以利用下做梦来帮助智能体改善学习效率呢?还是像民国女作家萧红建议的,“生前何必久睡,死后自会长眠”,把睡眠时间缩短些呢?
二、梦境学习
假设梦除了休息、帮助我们调适情绪、抒发内在的心情和担忧的功能外,还是一种学习方式,那么它和我们人工智能中常见的学习模式有何区别呢?
粗略来说,涉及到学习的人工智能方法主要有两种,一种称为监督学习(supervised learning),也有称为有教师学习的,一种称为无监督学习(unsupervised learning)或无教师学习,俗称自学成材。监督学习的特点是学习的时候,每给一个样本,就会赠送个标签。比如人脸识别中,张三就是张三图像的标签。如果给10个人的10张人脸加上各自的标签,就有100张有标签的人脸图像。这些图像可以构成一组训练集,帮助训练一个人脸识别的模型,使之能对未知的人脸图像有好的识别性能。训练集的多少往往决定了识别性能的优劣。比如目前已经在国内的很多高铁站、机场布置的人脸识别或认证系统,其性能稳定和优异的原因之一是训练集里的样本规模非常大。而另一种学习方式,非监督学习,则无需标签输入。它主要是根据样本集合中的某种结构或相似关系来将样本聚成多个类别。比如图2所示、格式塔心理学中提到的、根据点的疏密程度来自动聚类,就是人或智能体的一种无监督学习模式。
图2:无监督学习。左:自动根据黑白程度聚类;右:根据疏密性聚类
除此以外,介于监督和无监督之间的为弱监督学习。举例来说,我们手机拍照后会留下大量的照片,这些照片很少会贴上标签或说明。类似地,在互联网上,也存在大量的未标注样本。在不依赖人力对样本进行过多标注,结合这些未标注样本的信息和少量有标签样本一起来训练预测模型的方式,就是弱监督的一种,即半监督学习。还有基于这三种模式衍生出来的其他学习方法,但大同小异。
与人工智能常见的这些学习方法相比,梦有以下四个不同的特点。
第一,学习是需要样本或特征输入的。按激活-合成假想理论,梦境中输入的特征随意性较大。而且,从大多数报道的情况来看,梦境中的视觉图案模糊,不如真实视觉系统获得的细腻。Horikawa等曾试图在测试者睡眠刚开始时,通过叫醒并纪录对梦境的文字回忆来重建视觉信息[5]。但这仍是一种间接方式,真正的图像还很难直接从人脑中提取出来。另外,梦在多数情况下是灰度的,没有颜色。当然有些艺术天赋好的,偶尔也会梦到彩色,甚至很精细的彩色图像。值得指出的是除了视觉外,其它“感官”系统也会参与梦的构成。
第二,梦是很少重复且容易被忘记。据说醒来5分钟后,我们会忘掉50%梦的内容。10分钟后,90%的内容会忘掉。可能的原因是1) 梦中的影像并不强烈、模糊,缺乏细节描述,2) 与常规的学习模式不同,梦也没有传统学习中常见的关联和重复性。所以,不像白天的行动那么不容易忘记,使得梦很少被认为是一种潜在有效的学习方法。
第三,梦有助于创新性成果的产出。一个广为流传的传说是,德国化学家凯库勒(Kekule)曾在梦中看到旋转的碳原子,其长链像蛇一样,头尾相连成圆圈。因此他悟出了苯环的环状结构,形成了世界有机化学界最轰动的成果之一。据说,很多音乐家如贝多芬也能在梦中寻找到灵感。不过因为梦里的故事都只能由当事人来表述,所以很难获得客观性的实证。
第四,梦不是特定任务的学习,每个梦的故事线都不同,且具有时间的连续性。需要注意的是,这一故事线不管是贴近现实还是异常奇幻,都与做梦的主体曾经有过的经历相关。比如没坐过火箭,人就不可能有与火箭驾乘感一致的真实体验。
显然,直接利用平时的梦来促进学习的难度是很大,但并非说完全用不了。举例来说,(Hobson,2009)的研究认为REM睡眠与体能相关技能的学习相关,而与死记硬背之类的记忆关系较小[4]。对这种相关性,他们从“婴儿和幼儿较成人有更多的REM睡眠”获得了事实上的支持。
不仅如此,国外还有研究团体专门研究如何让梦参与学习。粗略来说,可以分成三类。一种是提高梦的召回率,即把梦境里的内容尽可能记下来,属于被动式学习。其方式也相对简单粗暴。比如在睡前,暗示自己要记住自己的梦;或者把笔和纸或手机放床边,方便随便醒来记下;或者试着慢慢地醒来以维持在最后一个梦的情绪里;或者多喝点水以确保半夜能从梦中醒来。
第二种为主动式梦境学习。与平时的做梦方式不同,这是一种特定的做梦形式,叫清晰梦境(Lucid dreaming)[3]。直观来说,做梦的人能意识到他在做梦,他能控制梦中人的姿态、梦境的叙事方式和环境。比如多数与飞行相关的梦都是清晰梦境的结果。研究表明,这种梦境有可能能帮助智能体学习。据估计,在美国只有不到10万的人能有清晰梦境的能力。
清晰梦境的研究最早可以追溯到1959年,Johann Wolfgana Goethe大学希望发展一套有效的技术来诱导梦境。到1989年,德国梦研究家Paul Tholey提出了反射技术(Reflection),并成功诱导。该技术的不足是,整天都得询问自己是醒着还是睡着了。
随后,斯坦福大学清晰研究院(Lucidity Institute)的Stephen LaBerge,和Lynne Levitan等学者也就此进行了广泛的研究。他们提出的“现实测试”(Reality Testing)和“清晰梦境的记忆诱导” (Mnemonic Induction of Lucid Dreams,简称MILD)目前是清晰梦境研究领域最成功的技术之一。不像反射技术,MILD只需在晚上进行提醒。它要求实验者睡觉前需暗示自己记住梦,然后集中注意力识别什么时候在做梦以及记住它确实是梦。然后再沉思重新进入最近的一个梦,并思考它确实是梦的一些线索。同时,还可以想象在梦里将会做什么。最后,不断重复“识别什么时候在做梦”和“重新进入一个梦”的步骤,直到睡着为止。
另一种主动式梦境学习是梦境孵化(Dream Incubation),即学会在某个要发生的特定梦境主题里种下一颗种子。比如反复暗示自己要做一个关于化学实验的梦。那些相信能通过梦境来求解问题的人,可以利用这一技术来诱导梦境到特定的主题。与清晰梦境的主要区别在于,梦境孵化将注意力集中到了更特定的问题上。
基于以上的讨论,不难推测,除了常在心理学和生理学中讨论的功能如发展个性、增强自信、克服恶梦、改善大脑健康外,梦境学习可能有助于形成创新性的问题求解。如果条件成熟,清晰梦境甚至可能变成一种“世界的模拟器”或“大脑中的平行世界”。它允许人类在更安全的环境下学习各种技能,学习生活在可以想象的任意世界,经历和选择各种可能的未来。不仅如此,Stephen LaBerge还尝试过用眼动来辅助,让做梦的人与观察员实现梦中交流,尽管这种交流还十分有限。
另外,梦境中的学习效率可能比我们以为的要高,其原因是睡眠状态中的时间是主观而非客观的。比如唐代《枕中记》,卢生的“黄粱一梦”竟然在一顿饭的睡眠时间里,享尽了一生的荣华富贵。虽然是小说里的夸张手法,但或多或少也表明了,人们主观感觉到的梦境时间要比客观时间长。因此,利用可以做梦的六年时间进行高效学习也不是不可能。
睡眠中学习,说不定在未来星际旅行中也能起重要作用。毕竟就我所知,现在还没有哪部科幻片和科幻小说讨论过如何充分利用睡眠和做梦机制来帮助学习的。
三、庄周梦蝶与缸中之脑
我相信每个人都会做梦,不管是否能够记住,都会有错把梦当成现实的时候或者“醒来后”发现实际还在梦里的经历。
关于梦的这种错觉,古今中外都曾有过一些很有意思的哲学层面的思考。举例来说,战国时期的道家代表人物庄周在其作品《庄子·齐物论》中曾有一段描述:
昔者庄周梦为胡蝶,栩栩然蝴蝶也,自喻适志与,不知周也。俄然觉,则蘧蘧然周也。不知周之梦为胡蝶与,胡蝶之梦为周与?周与胡蝶,则必有分矣。此之谓物化。
这段故事谈到了庄周梦见自己变成了蝴蝶,以至于在梦中不记得自己是庄周,直到醒来后才方知自己是庄周。于是,他产生了一个困惑,究竟自己是庄周梦见的蝴蝶,亦或是蝴蝶梦见的庄周呢?
图3庄周梦蝶(左)与缸中之脑(右)
在古代,这种疑问在世界上有多个版本,如印度教的玛雅错觉(Hindu Maya illusion),帕拉图的山洞寓言(Plato's Allegory of the Cave)以及1641年笛卡尔在《第一哲学沉思录》中冥想的邪恶恶魔(Evil Demon)。
在当代,美国著名哲学家希拉里•普特南在其1981年著作《理性,真理和历史》中提出了缸中之脑(Brain in a vat)的问题 [1]:
假定某人(比如你自己)被邪恶科学家实施了手术,大脑被剥离出来并与身体分离,放在如图的培养液中,然而利用先进技术将大脑的神经末梢连接至计算机上。计算机会根据预设的程序来向大脑发送它需要的各种信息,使大脑产生一切都正常的幻觉。这种情况,对你来说,一切都和平时无异。你喜欢的人、事、物,你爱的运动、身体感觉都通过计算机来百分百逼真的还原,偶尔还会给点大脑之前保存的记忆,让你有怀旧的感觉。也可以通过计算机模拟复杂场景,让你产生参加鸡尾酒会、和朋友交谈、开怀畅饮的幻觉。
在这个情形下,你如何确保你自己不是在这种困境之中呢?
事实上,有不少影视作品与这一哲学问题相关。如1999年开始上映的《黑客帝国》及其系列,剧情里“正常的现实世界”实际上是由“矩阵”的计算机人工智能系统控制着。再如2010年克里斯托弗·诺兰的电影《盗梦空间》,即使到了剧终,那旋转的陀螺还是让人猜不透是在现实还是梦里。2018年1月上映的电影《移动迷宫3:死亡解药》中,米诺被WCKD组织控制着,连着外部计算机的大脑就像缸中之脑,使得他长时间活在恐怖幻觉之中,饱受精神折磨。在2018年3月上映的电影《升级》(Upgrade)里,人工智能芯片被移植到男主角身上后,成功地将男主角的大脑困在“缸中之脑”中,给其营造了一个虚幻的世界,而真正的躯体则被人工智能芯片接管了。
图 4 《黑客帝国》的矩阵(左) 与《盗梦空间》的剧照(右)
在这些假设中,之前提及的笛卡尔的名言“我思故我在” 似乎已不是那么明显的成立。因为缸中之脑也能“思考”,但它的“自我”认知却可能是被人为加到大脑上诱发的错觉。结果,这一哲学问题长期困扰了很多对人工智能及相关领域感兴趣的研究人员。甚至刚逝去不久的物理学家霍金也曾于2016年4月在媒体上表示过“在区分梦和现实上,人类还无能为力,只有等我们能真正了解意识和宇宙后,才有可能”(原文:but we humans just don't and perhaps can't know if we are living in our dreams or reality, at least not until we start to understand more about consciousness and the universe)。
如果目前的能力还无法做到有效区分,那么抛开哲学问题不提,我们应该可能通过梦境实现与现实相等价的学习。我们也可以利用这种不可区分性,在未来战争中形成新型攻击模式,即对敌人实施“缸中之脑”式的攻击,从而让其为攻击方服务而不自知。
不管何种攻击,这都源自大脑在神经和认知方面的错觉。那实际生活中,认知存在错觉吗?
张军平
2018年11月12日
参考文献:
1. 希拉里·普特南著,童世骏,李光程译. 理性、真理与历史 (Reason、Truth、and History). 上海译文出版社,2005
2. https://en.wikipedia.org/wiki/Sleep
3. Lee Ann Obringer "How Dreams Work" 27 January 2005. HowStuffWorks.com. <https://science.howstuffworks.com/life/inside-the-mind/human-brain/dream.htm>
4. Hobson JA. REM Sleep and dreaming: Toward a theory of protoconsciousness. Nature Reviews Neuroscience, 2009
5. T. Horikawa, M. Tamaki, Y. Miyawaki, Y. Kamitani. Neural Decoding of Visual Imagery During Sleep. Science, 340(6132): 639-643, 03 May 2013, DOI: 10.1126/science.1234330
延伸阅读:
16. 爱犯错的智能体 --- 听觉篇(二):视听错觉与无限音阶的拓扑
15. 爱犯错的智能体 -- 听觉篇(一):听觉错觉与语音、歌唱的智能分析
14. 爱犯错的智能体 – 视觉篇(十一):主观时间与运动错觉
11. 爱犯错的智能体--视觉篇(八):由粗到细、大范围优先的视觉
张军平,复旦大学计算机科学技术学院,教授、博士生导师,中国自动化学会混合智能专委会副主任。主要研究方向包括人工智能、机器学习、图像处理、生物认证及智能交通。至今发表论文近100篇,其中IEEE Transactions系列18篇,包括IEEE TPAMI, TNNLS, ToC, TITS, TAC等。学术谷歌引用2800余次,ESI高被引一篇,H指数27.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-28 17:02
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社