||
以下文字只是草稿(版本4.3),征求你的评论和反馈,以求对每个人都有用,不论你是否会给计算机编程!
====
回顾历史,公众对科学的接受步伐总是缓慢的。譬如,查尔斯·达尔文因为顾忌公众的反映等待了大约20年(从十九世纪30年代到1858年)才发表了他的进化论。直到20年以后(十九世纪70年代)科学界和一般公众的许多人才接受了进化是一个事实。当然,关于进化的争论至今还在持续着。
是不是公众对科学的接受在现代就加快了?不一定如此,虽然我们有了更良好和更快捷的通讯方法。其主要原因还是没有变化,而且是更加剧了 —— 余下了的未解决的科学问题是更复杂而且所需要的知识超出了任何一个人的现有知识范围。
举例来说,脑的类网络计算——联接主义计算——已长期地被工业界质疑和忽略了。深度卷积网至少在1980年就被提出了。深度卷积网中的最大汇集方法在1992年就已被发表。但是,苹果、百度、谷歌、微软、三星和其它主要相关公司直到2012年后才显示相当兴趣。这是一个约20年的延迟。以上提到的两项技术并不是很难理解。然而,这两项突然火起来了的技术已经被发现了的更根本更有效的脑工作原理证明是已经落后了。此文直观地解释六个脑工作原理。
工业界和学术界的兴趣对两件事的结合很热心——容易理解的测试和有哪个主要公司在参于。工业界读到了这样的声明:“简单地等到更快的图像处理卡和更大的数据集,我们的结果就会被改进了”(Krizhevsky et al. NIPS 2012)。可是,近来被揭示的脑原理已经告诉我们,这些测试的方法只能带来的改进会消失,不会趋于像似人类那样的零误差率,不管摩尔定律还可以持续多久,也无论在训练数据集合内加了多少静态图像。为什么? 这是因为这样的静态训练集阻碍参加者考虑自主目标分割的问题。 人类婴儿脑子里的神经元是通过婴儿与实际物理世界的交互来学习目标分割的。是不是我们的工业界和公众再需要一个20年?或更久?
在另一方面,神经科学领域和神经心理学领域已经通过提供实验数据而取得了很多进展(如,Felleman & Van Essen, Cerebral Cortex 1991)。然而,众所周知,这些领域是数据多但理论弱。这些领域里研究者们只使用局部工具(如吸子模型),所以被脑的丰富现象(如线路和行为)所压倒。他们缺乏计算机科学的整体性的自动机理论的指导。其部分原因是过去的自动机的网络模型不是自然地涌现的。举例说,神经元的多选择性(如, X. -J.Wang et al. Nature 2013) 过去分析得很少但被广泛地观察到。但这神经元的多选择性已经被在发育网内的图灵机在理论上完备地解释了。这种新的图灵机中神经元的多选择性是由涌现了的漂亮的线路造成的,但每个神经元还是用一个它的高维而动态的输入空间里的简单的内积相似性。
2011年10月一位很受人尊敬的多学科教授慈善地写道:“我告诫这些研究生,他们能从事脑的研究而干好科学。或者从事机器人的研究而干好工程。然而,如果他们试图同时两项都从事,其结果必然既不是好科学也不是好工程。”工业界和公众需要多久才能接受这个对脑的悲观看法在当时就已经不再正确了呢?
已经被揭示的脑原理可能给多个方面带来一系列根本的变化,包括人类生活的方法,国家和团体的组织方法,我们的工业,我们的经济,以及人类是如何互相对待的。
已知的人脑的原理告诉我们, 任何人的大脑,无论他的教育和经验如何,是根本性地短视的。在空间和时间上都是如此。海特(J. Haidt) 教授在他的专著《自以为是的心灵: 为什么政治和宗教分裂好人群》对这种短视有很好的证明,虽然这种证明不是通过脑计算的语言。
用脑计算的语言来讲,你的脑子里的精准的线路是漂亮地自主地连接成的。怎样连接由你的实时经验来决定,而基因组只是起一个调理的作用。脑抽象所需要的各种不变性也是主要地取决于实时经验。血清素(譬如由威胁产生),多巴胺(譬如由赞扬产生)和其它神经递质快速地加偏向于这些线路,而使更长期的想法在竞争中失去发放的机会。并且这些偏向有长期作用。所以,你犯了长期性的错误但你还是感到你是对的。每个人都是如此。由于经历的不同,短视的内容会不同。
从传统的观点出发,许多领域的专家认为计算机和脑好像用了很不同的原理。 已用数学证明了的在发育网内自然地涌现的图林机(J. Weng,“脑作为一个涌现有限自动机:一个理论和三个定理”IJIS, 2015)应该改变我们的直觉。这新结果提出了以下六个脑原理:
1、发育程序(类似基因组,非指定任务)调理一个非指定任务的“脑”网络---发育网---的发育(终身学习)。原则上,发育网是通用的,具备学习任何任务的能力,只要肢体干得了。
2、大脑中的图像是自然感知到的由很多物体混合在一起的杂乱场景。在典型的机器训练中(譬如,Krizhevsky et al. NIPS2012),每个训练图像有一个划分边框框出要学习的物体。而一个人类孩子不是这样。发育网自己学习物体分割。
3、大脑的肌肉具有很多子区域,每个子区域或代表陈述性知识(抽象概念,如位置、类型、大小等),或代表非陈述性知识(如驾驶汽车或骑自行车)。
4、在物理世界的每个脑至少是一个在发育网里的超图灵机。在这个网里的每个区域(不是静止存在的,见M. Sur et al. Nature 2000和 P. Voss, Frontiers in Psychology 2013)使用一个统一的区域函数。这个区域函数是非线性的,但不会出现局部极小,和工程的直观相反。
5、脑的发育网的学习是增量式的——即每个时刻采用一个“感知-运动”模板对来更新“大脑”,随后立即将其丢弃。换言之,真正的大脑只有一对立体视网膜,不能储存一对以上的图像。
6、脑的发育网总是最优的——每个网络更新计算“大脑”的最大似然估计,基于有限的计算资源及出生后至今的有限学习经历这两个条件。
脑的逻辑完备性(部分,不是全部)可以从在发育网里的通用图灵机来理解。 通用图灵机在原则上类似于我们的现代计算机。这个自动机脑模型指出每个大脑都是一个自动机,但是又区别于传统的符号自动机,因为自动机脑模型实现自我编程——即涌现。传统的图灵机都无法自己编程,但是脑图灵机可以。
自动机脑模型已经预测了脑线路动态地、精确地记录来自经验的统计量。这和神经解剖学实验大致一致(见Felleman& Van Essen, Cerebral Cortex,1991)。作为特例,该模型预测了“’人’和’车辆’之间的注意转移会极大地改变所有分类在大脑中的表达”(J. Gallant et al. Nature Neuroscience, 2013),并且人类的注意力“会调节其内侧颞叶中神经元的活动”(C.Koch et al. Nature, 2010)。关于位置细胞的工作获得了2014年诺贝尔生理学和医学奖。该工作暗指神经元只对自下而上的信息(位置)进行编码。自动机脑模型对该观点提出了挑战:神经元对自下而上的内容(譬如位置)和自上而下的内容(譬如目的)均进行编码,正如Koch et al.和Gallant et al.所报道的那样。
遗憾的是,自动机脑模型意味着所有的神经科学家和神经网络研究人员们在没有得到严格的自动机理论训练时,是无法理解他们所研究的脑的。例如,传统的神经系统模型和传统的神经网络专注于对模式的识别,但却不具备一个接地符号系统应该具备的功能(如“规则式地组合和再组合,” StevanHarnad, Physica D, 1990)。自动机理论就具备这样的功能。该新观点是否让我们的学生和研究人员们感到震惊,还是可以指引他们把时间花在更加有意义的事件上?
理解脑自动机可以帮助我们找到许多重要问题的答案,其中一些将在下面列出。 自动机脑模型预言:任何大脑中都没有绝对的对或错,但其环境经验会对大脑进行连接和再连接。我们在此仅仅提出问题,并不给出是或者否的答案。
我们的工业界和公众如何才能意识到理解大脑的大门已经向其敞开?人们如何才能看到这带给他们的经济前景?
我们的教育系统应该如何进行改革来迎接新的脑时代?我们的政府是否对该来自自然的现代召唤做出了迅速并正确的回应?
我们年轻的一代面对展现在他们眼前的此次机遇应该如何行动?当前狭义的学位对其职业生涯真的足够吗?
每个人应该如何好好利用有关其自身大脑的新知识,从而使其职业生涯更加成功呢?这包括政治家、官员、教育者、律师、企业家、医师、技术员、艺术家、工人、司机、和其他任何脑力和体力工作者。
无论他们身处世界的那个角落和干什么。我们每个人都受同样的脑原理支配。每个人的大脑自动编程。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-16 19:40
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社