晴朗的天空分享 http://blog.sciencenet.cn/u/stone1971111 数学博士学位;现从事图像处理、信号处理的算法和系统研究。

博文

人的智能:选择不同的路,就意味着用不同的样本训练自我 精选

已有 27173 次阅读 2017-9-19 09:00 |个人分类:科研随想|系统分类:观点评述


( 图片来源于网络)    

最近人工智能很火爆,不光是投资界火爆,国家也提出了未来人工智能发展战略和规划,这在全世界都是独一份。更有甚者,介绍深度学习的很专业的文章能够在各个网站和微信中广泛传播,一时间似乎所有人都能掌握并理解人工智能的算法。我不算做深度学习的,尽管我们也在用,也有学生在研究深度学习算法,都是照葫芦画瓢,当然,很多算法对实际工程的效果确实有益。人工智能未来的一个很重要研究方向是如何提高人类的教育水平。我们既然可以通过改进学习训练算法显著提高机器学习的能力,那就完全有可能通过改进教学方法来显著提高教育的效果。当然,教育的问题始终是人类的难点,迄今还没有一个公认的最好的教育方法,能够让每一个人都能够得到充分的教育而达到个体的最佳状态。

  其实教育是一个永远不能充分完成的任务,我们都时刻处于被教育的过程中,同时,也不断采用经由教育获得的能力从事工作。尽管现实的教育模式和现在热门的人工智能机器学习没有显然的关系,可是找到其中的类似点似乎并不是一个平凡的问题。早上醒来的时候,突然想到,如果把人比作一个待训练的网络(这个类比应该成立,毕竟人工神经网络只是部分模仿人的大脑,说明迄今为止我们所用的所有神经网络的拓扑结构不会超过大多数人的大脑结构),那么下一个问题就在于,我们用什么样的样本去训练这个网络?当然,这个问题在每个人学校受教育阶段是不用回答的,或者基本不用操心,因为教育家们通过各种各样的教材提供了训练样本。即便我们都努力学习,但是最终的结果是,这个训练过程带来的效果并不是一致的,个体差异性依然非常明显。这说明,现有教育体制提供的训练资料或者样本是不充分的,从而导致不同大脑间哪怕细微的差别都可能导致训练结果的较大不同,这不是大数据训练该有的结果。事实上,我们人类教育的过程并不是一个大数据输入的训练过程,仅仅是经过精挑细选的小样本训练过程。我们都知道,小样本训练最大的问题在于容易过学习或者过拟合,现实当中很多书呆子就是过学习的典型。

   人的教育并没有随着学校教育的结束而停止,事实上,大多数人的关键技能甚至感悟都可能是走上工作岗位以后不断学习和思考得来的,而学校教育仅仅是提供了一个具备了自主进化能力的初步网络,还需要自我不断训练才能够获得更好的训练结果。那么,在工作和生活中,我们是如何给自身的神经网络提供样本的呢?大多数情况下,每个人都是按照社会预设的路线进行生活,因此大多数人对于样本的选择也是被动的,而结果自然也就千差万别,有些人发展的很好,除了运气的因素之外,还不排除TA遇到的样本对他个体的训练效果更好。从机器学习的结果来看,如果排除了网络拓扑和训练优化算法的差异,样本将是决定性的因素。我们也许没有意识到,我们在很多看似不经意的关键点所选择的人生路线就是一个挑选不同样本的关键过程。过去我们一直同意人的发展关键在于选择,但是为什么选择就那么重要呢?其实每一个人都不具备远期预测能力,导致结果发生重大差异的可能性来自于不同路线提供的生活样本不同,外界的条件不同,因此训练的结果也就不同。

   当一个人选择一条很保险的道路是,他遇到的样本都是成熟的样本,周围都有相似的结果存在,训练的梯度效应并不明显,因此训练的结果自然不会更好。因此,一个一直很安逸的人(不仅仅是物质上,也是精神上安逸)不可能得到更好的训练,从而也不能做出杰出的成就。

而当一个人选择一条看似当时有风险的路,他选择的样本就具有很强的拉动性,这些样本可能远离一般样本,对个人训练的价值远大于那些集中而没有特色的样本,这样的训练过程无疑是更高效的。当然,从生活角度来说,选择密度较小的样本,甚至在别人看来是例外的样本本身具有很高的风险,毕竟人的生存需要起码的物质保障。

尽管上面的类比推理不完全符合科学,可能直觉上具有一定的参考价值。当我们每一步都选择不同属性的样本,都是对自我训练集的扩大,客观上有利于获得具有更广泛价值的结果。当然,前提也是有,就是能够在这样的样本挑战下,自我训练能够收敛。如果一个网络拓扑过于简单,试图训练复杂的模型无疑问是自讨苦吃。尽管每个人都不相信自己的大脑是简单的,可是针对无限复杂的世界,大脑可能还是比较简单的。因此,恰当的选择一条路既能扩充样本,又能保证自身能够顺利收敛,无疑问是非常关键的。遗憾的是,我们在大多数情况下,并不是有意识的从自我训练的角度思考或者选择,而是从相对功利的角度思考,这肯定对于人的持续成长是不利的。一家之言,仅供参考。

silong.peng@ia.ac.cn

2017.09.19





https://blog.sciencenet.cn/blog-39416-1076643.html

上一篇:未来二十年,我们要有鼓掌让贤的胸怀
下一篇:警用影像处理技术手册前言
收藏 IP: 159.226.20.*| 热度|

21 陈南晖 应行仁 黄永义 徐令予 王从彦 张海权 曹峰 武夷山 谢勤 陆泽橼 周忠浩 鲍海飞 王林平 罗鸿幸 强涛 邱嘉文 王福明 zjzhaokeqin yangb919 xlsd lrx

该博文允许注册用户评论 请点击登录 评论 (17 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-4 01:13

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部