windhawk的个人博客分享 http://blog.sciencenet.cn/u/windhawk

博文

学习观浅思 精选

已有 8506 次阅读 2022-10-24 12:36 |系统分类:人文社科

01 学习观

什么是学习?

通俗理解:学习就是获得新知识,提升新能力。

新知识可以分为两类,一类主要用于描述与我们息息相关的世界的样子,通常回答“是什么,怎么样”的问题,比如:

“天地玄黄,宇宙洪荒。日月盈仄,辰宿列张”——《千字文》

“剑号巨阙,珠称夜光”——《千字文》

另一类知识则主要用于描述世界变化的规律,用于回答“如何变”的问题,如:

“寒来暑往,秋收冬藏。”——《千字文》

“云腾致雨,露结为霜。”——《千字文》

对于第一类知识,学习的主要目的是重现,基本学习方式就是“记忆”。

对于第二类知识,学习的主要目的是泛化,即运用习得的事物发展的客观规律,来预测分类新事物,从而解决新问题。

两类知识虽然各有侧重,但是互相融合,实现他恰与印证,如第一类知识往往以案例的形式为第二类知识提供事实依据支撑,帮助大脑更好地理解、接纳与记忆;第二类知识也可以影响人们对于事物的认识角度与层次,从而获得事物本质不同程度的探究。

哲学上看,两类知识恰好对应了辩证唯物主义认识论中的实践与理性认识,各有区别,但又互相关联。

实践决定认识:实践是认识的来源,也是认识发展的动力,更是检验认识真理性的唯一标准,最终也是认识的目的和归宿。

认识对实践具有反作用:正确的认识能够指导实践取得成功,错误的认识会把人的实践活动引向歧途。

从学以致用角度分析,学习的最终目的是为了泛化知识以认识新事物,判断新形势,解决新问题。泛化学习的基本方式有归纳学习和指令学习。



02 泛化学习的基本方式:归纳学习

归纳学习,即从大量个别事实中推出普遍性原则,从中进行学习的过程。

在具备语言文字以及书籍传承之前,归纳学习一直是人们学习的主要的方式;即便在书籍教学普及的今天,归纳学习依旧是我们人生中最主要、最基本的学习方式。

归纳学习的基本过程可以分为以下过程:

有效材料收集→知识拟合提炼→知识有效存储→实践验证反馈

021 有效材料

归纳学习所需的实践材料需要具备两个基本条件。

第一个基本条件要求实践材料必须是完整的,从而可以用于建立、修正“行为→结果”反馈。通俗来讲,即要求实践材料必须“有问有答,有因有果”。

小明今天出门被雨淋湿了。(有果无因,无法形成有效行为结果反馈)

小明今天出门前没有关注天气预报,结果未带雨具,全身都淋湿了。(完整因果)

归纳知识:今后出门前一定要留意天气预报,提前做好防范。

第二个基本条件要求实践材料必须保持一定的差异性,从而可以突破认知瓶颈。其根本原因是:随着实践材料的积累,归纳所得结论已经可以解释应用于大部分样本,导致实际遇到重复性样本的概率也逐渐增大,若不能获得不同于以往的可区分样本,则不能再通过比较分析实践材料差异提升归纳认知。这也是平日学习做题到一定阶段后,会遇到瓶颈的原因,此时最好的办法即搜集补充差异性的新实践材料。

昨天我看到一只英短小猫,毛茸茸很可爱。(样本一)

今天我又看到了一只加菲猫,毛茸茸也很可爱。(样本二)

我所见到的小猫咪都是毛茸茸的,所以猫应该都是这样的。(归纳结论1)

网上见到更多毛茸茸小猫咪的可爱视频,进一步加强了既有结论1。

直到有一天逛商场碰到猫咪评比赛,第一次见到没有毛的斯芬克斯猫,原来猫也可以是没有明显皮毛的!(归纳认知升级→归纳结论2)

PS:重复的相似样本无法带来认知升级,只有差异性新样本出现,才会推动认识调整,突破瓶颈。

1_副本.jpg


022 知识拟合

搜集一定数量有效材料后,就可以通过分析比较同类不同样本间的共性与差异来拟合出该类样本的共有规律或模式,即泛化所用的规律性知识。

通俗而言,我们是基于已感知的有效样本(经验),提炼出共性规律或模式,然后应用于预测或分类任务,尝试判断新情况、解决新问题。但是实际中,我们并不能确保一次性达到最佳的客观规律拟合效果,可能会出现欠拟合或过拟合两种偏差。

欠拟合,即提炼拟合的规律连已有经验都无法全部解释;过拟合,则是说提炼拟合的规律可以解释已有全部经验,但是其实引入了过多的假设条件,导致无法适用于更多其他同类情况。

如对于给定数列『1,3,7,?』来预测第四项数据:

已知的数项1,3,7即为已知的经验;

若提出数列通项公式为『y=2x-1』,则只能符合“1,3”,x=3时y=5,与第三项7不符合,这里的通项公式甚至都无法满足已有全部经验,结果是欠拟合;

若提出数列通项公式为『y=x^2-x+1』,可见前三项都符合,但是第四项为13,而实际的第四项应为15(相邻项差为2的递增幂次方)

对待上述问题的基本解决方法有两个:

一是尽可能补充更多经验,即扩充有效材料,欠拟合或过拟合的规律/模式都会由于不能满足所有经验,因而很快暴露出问题;

二是遵循著名的“奥卡姆剃刀”原则,即:

如无必要,勿增实体。

当有多个假设都可以满足已有经验时,为了减少规律/模式对假设条件的依赖性,提高其鲁棒性,应当选择假设/条件最少、模型最简单的假设。

单次甚至多次提炼都无法百分百确保规律/模式与有效材料的科学拟合,总是会出现欠拟合或过拟合的偏差,因此实际中需要采取循环迭代的形式,不断逼近“客观真理”。这里又再次印证了唯物辩证法认识论的核心观点:

认识具有反复性和无限性,因此对真理的追求是一种波浪式的前进或螺旋式上升的过程。

对应本节的归纳提炼主题,我们可以推荐一种行之有效的“双例对比法”:

1. 选择一个特定的知识点;

2. 选择考查该知识点的两道题目(有效材料);

3. 分析比较两道题目在知识点表述与考查上的共性和差异,结合知识点反复理解特征要点;

4. 选择新的题目,尝试解题;

5. 重复(2~4)直到准确掌握该知识点。

023 有效存储

现代神经科学研究表明,知识的存储本质上是神经元之间借助突触形成的特殊网络结构;从该认识出发,人们提出了模拟大脑神经网络的深度学习网络结构,并在当今时代应用领域取得了巨大的进步,验证了上述认知模型的合理性。

然而我们的大脑并非一蹴而就的建立起新的神经网络结构,不仅需要调整的时间,也需要调整过程。

调整的时间需求意味着日常清醒思考工作时,大脑主要用于处理应对日常与手头事务,难以分配主要能源用于建构新知识结构,因此科学研究表明大脑多在睡眠休息时进行新知识神经网络的建构与调整,由此可以推知若不能保证每日充足的睡眠,大脑就无法获得有效时间建构/调整新知识,导致学习进程变慢。

调整的过程需求意味着大脑即便获得夜晚建构与调整时间,也绝非一蹴而就。从系统角度理解是自然的:只有相对不敏感的系统往往才有更好的鲁棒性,否则稍微遇到外界环境变化就会引发系统震荡。大脑新知识结构的形成与调整是一个多次迭代的过程,需要我们使用多种有效材料与有效验证反复刺激,以告知大脑相信确实有必要进行改变。

024 验证反馈

泛化学习的最终目标是应用解决新问题,因而实践验证不仅是最终目的要求,也是验证已有知识是否完备正确的唯一客观性标准。

验证反馈的前提是能够独立完整执行一次解题过程,从而让大脑清楚地感知到“问题→目标”,类似一次优化问题,必须首先明确优化目标是最小化误差或损失函数,然后才可以进行迭代调整。

验证的基本方式有两个,一个是将已建构的共性规律/模式应用于新实例,以验证是否有效准确。若验证成功,则反馈加强已有知识对应的神经网络结构;若验证失败,则将其作为新的有效材料,启动大脑对该知识网络结构的更新优化机制(可以采用双例对比法)。

另一种验证的基本方式是表述转换,其成立的基础在于,若自己真的理解了某个知识,则一定可以用自己的语言,从不同角度来描述其共性特征;换句话说,可以将新知识与已有旧知识建立关联,从而使用已有的旧知识概念来重新表述新知识。此方式最著名的应用莫过于“费曼学习法”:

1. 选择一个要学习的知识点或主题;

2. 假定你要将其讲给一个8岁的小学生听,对方丝毫没有专业知识与抽象逻辑基础,仅能听懂日常基本词汇;

3. 现在你要尝试用最基本、最简单的词汇来结构描述新知识/新主题,如果遇到任何阻碍或挫折,就证明其实并未真正理解,应当反复学习定义概念,并补充适当新材料(实例或指令),直到可以用基本词汇描述该知识点/主题;

4. 将上述重复学习扩充的材料梳理,使得其听来是一个有趣、逻辑通畅自洽的故事,并尝试讲给一个丝毫没有背景的人听,看其是否听懂。

细细想来,费曼学习法之所以成功,也许是因为其所要求的“基本词汇”恰恰是来自于既有归纳学习理解习得的夯实概念,因此若由这些夯实的概念关联解释的新知识,也便增加了可信度与坚实度;而努力尝试用上述“基本词汇”描述新概念的过程,就是努力将新知识与既有可信知识建立关联的过程。

有些专家科普时大谈科学术语,经常将听众讲得云里雾里,似乎高深莫测,实则能力有限;真正的大师往往可以深入浅出,用最易懂的语言描述最深奥的道理。

经过上述两种基本验证方式,我们通常可以得到已有知识的有效反馈,接下来就是根据反馈,循环执行上述所有过程,不断逼近拟合正确的知识。



03 泛化学习的基本方式:指令学习

031 有效指令

指令学习,即通过语言来描述定义、概念、公理、定理等共性规律/模式,从而迅速将一个前人验证过的知识教授给新个体。从有文字记载以来,指令学习逐渐开始成为学校教育的主要形式,其原因有二:

一是归纳学习容易受到个体认知与阅历局限,导致认知偏见,如常见的地域歧视等;相反指令学习可以向个体直接灌输一个相对正确知识的大致框架,避免严重偏差;

二是相对于归纳学习需要大量有效实例感知提炼,指令学习效率更快,而且借助书本等媒介便于大规模教育传授。

尽管存在上述优点,指令学习也具有自身特性,即专用术语体系。

专用术语一般用于描述特定领域内达成共识的概念、定理、规律等,其本身即可容纳传递相对丰富的信息量,对于具备共识的领域内交流,具有五一伦比的交流效率。然而对于尚未理解其前置知识的个体而言,无异于天方夜谭。

指令学习存在的基础是个体能够正确理解语言描述的知识,而这自然依赖于个体是否能够准确理解知识相关的前置性定义。

正因如此,有效指令的一个基本要求是:个体必须能够准确理解其中的描述性定义,否则就谈不上理解语言描述的知识。

此外,有效指令的另一个基本要求则是:语言知识的发布方必须足够权威。这点也是显而易见的,作为指令发布的知识理应经过一定程度的现实验证,否则自身就失去了知识价值。

032 精细加工

指令学习中的知识经过了前人在一定环境中的验证,但是依旧并未经过我们自己的验证,因此为了使其成为自己大脑中的固定的知识神经网络结构,就必须补上归纳学习的相关步骤——扩充实例。

没错,尽管指令学习相对便捷,易于传播,但是离开了实例体验,大脑接受起来就没那么容易了!我们的大脑习惯于从实例中感知共性,从而归纳提炼知识,如果直接告知一个新知识,大脑自然会保持谨慎态度表示质疑。

此时我们有两个基本方法来说服大脑接收新知识:

一个是扩充实例。数学上讲叫做“化归”,既然大脑习惯归纳学习,而我们现在缺少了归纳步骤,那么就主动扩充相应的实例供大脑感知、分析、比较、提炼共性,并与新知识相互验证,最终认识到新知识的正确性与重要性,接受并建构相应神经网络结构。

另一个则是关联已有就知识。已有旧知识往往已经得到大脑认可,采用“熟人说客”的形式,明显更容易让大脑接受,并加深记忆。而且孤立的知识难以记忆,相互关联的知识间存在关联,可以相互印证、彼此支撑,更加深了大脑对其判断的合理性、重要性标记,因而可以引起大脑的足够重视,为其改变。

本质上来说,我们的大脑是“贪图安逸”的,因为从进化生物学角度来看,大脑的存在不是为了认知提升,而是为了个体生存繁衍;过去为了生存下来必须尽可能节省能量,而大脑思考确实是最为耗能的(即便不思考也是全身最耗能器官),因此能不思考就不思考是大脑的自然选择。

对我们的启示就是:若想让大脑舍得发动马力开动思考,则必须让其充分意识到现在认知对象的重要性与正确性。

关于精细加工最为典型的应用莫过于华罗庚老先生的读书法:

1. 选择一本想读的书;

2. 第一遍读书时,尽可能对遇到的新概念、定义、定律扩充实例,主动验证加深理解;同时努力将新知识与已有旧知识关联,尝试用旧知识解释新知识;(将书由薄读厚)

3. 通过上述过程反复多次,习得知识的真谛,此时获得了知识的正确拟合,不再需要已有实例的支撑,大脑已经形成了知识的新知识网络结构,可以不再特意记忆实例了;(将书由厚读薄)

033 后续步骤

指令学习的后续步骤同归纳学习相同,都需要通过相似的有效存储与验证反馈,并通过多次反复迭代实现知识认知。



04 写在最后

本篇笔记的主要内容与灵感来自于最近学习观看的《断墨寻径》,其中列举了学习中常见的误区偏见,并借此展开介绍了基本的学习原理。

网上早已有不少相关的学习笔记,但大多是文字内容的摘录性笔记。如果将观看《断墨寻径》也看作是一种指令学习,那么为了更好地理解所述学习原理,在提炼知识阶段,理应基于自身经历主动扩充有效实例,同时尽可能将新信息、新知识与已有知识体系关联,相互验证支撑。

在验证反馈阶段,最好用自己的理解和语言重新表述相关原理,以检验自己对知识的掌握程度。

于是,便有了这篇关于“学习观”的思考笔记;希望其可以作为理解学习原理的一份“有效材料”,帮助大家从不同视角辨析理解学习基本原理。

感兴趣的朋友可以移步观看学习《断墨寻经》:

https://www.bilibili.com/video/BV1BQ4y1S7Yi/?spm_id_from=333.788&vd_source=ccf7c69afd95248edac46c3c02b836e7

文末附上自己总结的脑图,供大家参考:)




https://blog.sciencenet.cn/blog-993211-1360713.html

上一篇:当机器学习遇到安全:好的、不好的、以及糟糕的那些事
下一篇:读书 | 思考,快与慢
收藏 IP: 112.38.217.*| 热度|

6 彭振华 康建 薛亮 晏成和 孙颉 谢钢

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-15 19:03

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部