|
【内容提要】
一个多世纪以来,美国《科学教育》杂志持续发表有关科学教育文章,所代表的不仅仅是过去工作的资料宝库,还有可能为科学教育的历史以及特定领域的变化动态提供真知灼见。然而,百余年文字素材和研究文章的数量浩如烟海,对于教育工作者、研究人员、改革者和政策制定者可以提供怎样的启示,尤其对于教育4.0时代应如何弥合工业4.0和未来创新人才的差距,特别是可以为我国科学教育带领怎样的启迪。Odden等人(2021)将期刊中的研究分为 21 个不同的主题,组合为三个主题组:科学内容主题、以教学为中心的主题和以学生为中心的主题,量化了这些主题和主题群组随着时间推移的兴衰,并据此对科学教育领域的发展进行深入分析,包括国家政策变化对研究界感兴趣的主题的影响,不同主题之间的相互关系以及知识交叉渗透的影响。作者认为未来应在更大规模的教育文献和其他文献数据分析中为科学教育未来发展策略探索思路。
19 世纪未知艺术家(左)和William Jackson Hooker(右)绘制的植物插图
20 世纪 30 年代,植物学参考书中的药用植物图版
1 导言
近百年来,科学教育经历了战争、政治、理论和方法论的变革,以及社区的持续努力,与1920年相比发生了巨大变化。这些变化不仅改变了科学教育的实践方式,也影响了人们对科学教育意义的理解。尽管如此,一些主题在科学教育领域的历史中反复出现,被不断重新发现和强调。研究者和改革者对这些主题和转变感兴趣,以解答科学教育的关键主题是什么、它们的出现时间和演变过程,以及教育工作者对当前话题的长期关注程度。
作为科学教育研究人员、实践者、历史学家和改革者,我们有兴趣了解这些主题和转变。它们可以帮助我们回答重要问题,例如:
(1) 历史科学教育中感兴趣的关键主题是什么?它们是如何以及何时出现的?
(2) 教育工作者思考、处理和讨论我们今天关心的话题有多久了?
(3) 某些主题是否发生了演变、转移或对该领域的历史产生了新的兴趣?
科学教育文献的历史悠久且庞大,使得研究人员难以全面掌握。尽管有针对性的文献综述有助于聚焦特定关键词或概念,但无法覆盖全部内容和历史深度。近年来,自然语言处理技术的发展为自动分析大量文献提供了可能,使研究者能够通过算法处理和分析数千篇文章,从而提取关键主题并追踪其发展。
利用潜在狄利克雷分配(LDA)技术,对《科学教育》期刊自1920-2020年的文献进行了主题分析,揭示了科学教育研究的发展趋势和主题变化。研究旨在介绍LDA方法,并通过自动化元级文献综述,展示不同主题随时间的流行程度,帮助研究人员理解科学教育研究的历史演变。
2 使用 LDA 进行主题分析
作者采用了潜在德里希勒分配(Latent Dirichlet Allocation, LDA)技术进行分析,这是一种自然语言处理领域的无监督机器学习方法, 无需人工标签或预设结果,通过输入参数让算法自主发现数据模式,帮助研究者观察和解释趋势。更具体地说,LDA是一种自动主题分析技术,旨在从文本集合中识别潜在主题。它基于假设每篇文本都由一组未明确表达但作者知晓的主题构成,需要通过算法或读者推断出来。
LDA算法基于一个假设:相似的词汇使用模式通常指向相似的主题。它通过识别经常一起出现的词汇群来确定文档的主题。例如,频繁使用与“狗”相关的词汇可能表明文章主题与狗有关。LDA还假设文档是由不同比例的主题混合而成,如某篇文章可能主要讨论狗,另一篇则可能狗和户外生活主题各占一半,还有的文章可能只有极小部分涉及狗。LDA模型基于一个假设,即每个主题可以表示为一组词语及其概率分布。这意味着在特定主题的文章中,某些词语出现的概率较高,而其他词语则较低。例如,生物学主题的文章可能会频繁使用“生物学”和“细胞”等词,而不太可能使用与物理相关的词汇如“加速度”或“扭矩”。尽管如此,LDA认为每个主题都可能包含所有词汇,只是使用频率不同,生物学文章也可能使用“扭矩”一词,但频率较低。
LDA算法通过“词袋”模型,忽略单词顺序,仅考虑单词在文档中的出现频率,以推断文档的主题分布。算法迭代地优化主题词分布和文档主题比例,直至达到准确度阈值。用户需设定主题数量、混合程度和迭代次数。为提高性能,需过滤掉无特定语义的“停止词”。LDA(潜在狄利克雷分配)算法自开发以来已广泛应用于政治、软件、新闻和学术等多个领域,用于主题提取、功能分析、态度分析和研究热点识别等。LDA能够处理大量文献,实现自动文献综述,揭示主题随时间的演变。本研究旨在利用LDA分析《科学教育》杂志上科学教育研究的主题及其随时间的变化情况。
研究问题如下:(1) 《科学教育》杂志上发表的科学教育研究文献在上个世纪主要涉及哪些主题?(2) 随着时间的推移,这些话题的流行程度发生了怎样的变化?文章总结了生活中的科学(主题1)、地球与空间科学(主题2)、物理科学(主题3)、生物科学(主题4)和光照与观察(主题5)等五个科学内容主题及其随时间的流行度变化。主题1关注自然和机械现象,流行度在1920-30年代下降;主题2涉及地球和空间科学,流行度自1950年代起保持低水平;主题3侧重基础物理科学,1950-80年代有较高兴趣;主题4关注生物科学教学,流行度分布均匀;主题5关注儿童对光影的观察,流行度随时间保持一致。整体上,各主题的流行度变化趋势在图表中有所体现。
不同时期文献中最热门话题的堆叠区域图
3 结果
3.1 主题和总体趋势
研究中排除了与科学期刊业务相关的两个主题,剩余的21个主题被分为三组:关注特定科学内容的主题(1-5)、以教学为重点的主题(6-13)、以及以学生为中心的主题(14-21)。每个主题组的内容和出现时间顺序在相应的表格和图表中展示。
通过分析主题分组和普及率图表,发现除了“日常生活中的科学”(主题 1)外,其他科学内容主题的流行率在一段时间内保持相对稳定。这表明这些主题持续受到研究兴趣,常作为研究背景。主题 1 的流行和快速下降可能与期刊出版重点的转移有关,早期《科学教育》期刊大量发表以“科学故事”为主的体裁,,其形式包括对话、戏剧或对日常生活中科学现象的描述,可作为课堂教学或课程启发的范例,但后来这类文章逐渐减少。
按主题分组的热门话题堆叠区域图:课程内容热门话题(褐色,上图)、以教学为重 点的热门话题(青绿色,中图)、学生热门话题(灰白色,下图)
1970年前,科学教学讨论集中在教授技巧和科学教师培养上,涉及教育技术应用、专业教师发展及科学教育目标。1970年后,科学教育教授技巧和科学教师培养主题减少,而以探究为基础的课程改革、科学与社会文化问题、科学史哲学及教师职业发展等主题成为主流。
在以学生为中心的教育研究领域,经历了三波研究浪潮。第一波关注学生成绩的定量测量,反映了科学教育研究者将实验和统计方法应用于教学研究的早期尝试。第二波在20世纪70年代兴起,涉及教育心理学相关研究和学生兴趣、动机的定量分析。第三波在20世纪80至90年代关注学生心智模式、概念变化、科学知识表征、论证使用及科学身份认同。同时,关注种族、性别和STEM传媒的专题贯穿第二波和第三波研究,尤其在80年代中期和2010年后有显著增长。
为展示期刊主题变化,制作了叠加区域图,其中线条宽度代表主题流行度。应用3年滚动窗口平滑化数据,进行重归一化处理确保图表流行率总和为100%。主题按聚焦科学内容、教学和学生分组,从上至下排列,以观察各主题及三类主题随时间的发展趋势。
科学教师培养相关主题的流行率图
《科学教育》期刊的发展经历了从科学内容到教学主题,再到以学生为中心的转变。早期以“日常生活中的科学” 为主,20世纪30年代中期转向科学教师培养等教学主题。70年代,学生主题成为焦点,占据一半关注度。90年代教学主题复兴,但90年代末起,社会文化和学生主题如“论证与科学实践”和“科学身份与话语分析” 再次成为主流。
研究表明,随着时间的推移某些主题相对于其他文献的重要性有所上升,在某些时代明显占据了流行图的主导地位。这些主题包括:
² 日常生活中的科学(主题 1):在 20 世纪 30 年代初之前一直占主导地位。
² 科学教师的培养、课程开发和技术(主题 6):在 20 世纪 70 年代初之前一直占主导地位。
² 教育心理学与问题解决(专题 16):20 世纪 80 年代中期以前一直占主导地位。
² 科学史与科学哲学(专题 11):在整个 20 世纪 90 年代占主导地位。
² 论证与科学实践(专题 19):自 2000 年代中期以来占主导地位。
² 身份与话语分析(主题 21):也是自 2000 年代中期以来占主导地位。
《科学教育》期刊研究主题的演变,表明过去半个世纪,主题1(日常生活中的科学)和主题6(科学教师的培养、课程开发和技术)逐渐淡出,而20世纪90年代前不为人知的新主题成为热点。而在过去四分之一世纪中最流行的主题在 20 世纪 90 年代之前几乎无人知晓,科学史与科学哲学(主题11)是个例外,它在90年代占主导地位,并且在期刊的整个历史中都受到重视,反映了对科学思想、态度和方法的持续关注。
科学实践相关主题的流行率图
本研究通过总结《科学教育》杂志上个世纪的文献,揭示了科学教育研究的主要主题,并分析了这些主题随时间的流行趋势变化。接下来,研究将深入探讨主题间的相互关系及变化原因。
3.2 特定趋势和主题关系
该分析揭示了科学教育文献随时间变化的趋势和模式,这些变化可能与国家科学教育政策、地缘政治事件、编辑优先权以及理论框架、研究兴趣和方法的转变有关。认知心理学的发展促进了科学教育研究,如“儿童的想法”和“教育心理学与问题解决”主题的兴起。STEM(科学、技术、工程和数学)教育管道(主题 20)有两次明显的关注浪潮:一次是在 20 世纪 80 年代,另一次是在 2005 年左右。通过分析这些趋势,可以构建科学教育领域发展的可能叙事。
(1) 科学教师准备的转变标准和目标(主题 7 和 12)
在教学重点专题组中,科学教师培训与内容准备(专题7)和教师专业发展与科学教师教育(专题12)关系紧密。早期期刊关注专题7,涉及教师培训和课程规划,但自20世纪60年代末起,专题12关于教师信念、实践和指导的流行度上升。两个主题在70年代初至90年代中期有重叠,之后分化明显。专题12 在90年代末达到高峰,强烈关注科学教师的专业发展,可能与1996年《国家科学教育标准》的发布有关。
(2) 实践转向(主题 11、18 和 19)The “practice turn”
分析表明,科学史与科学哲学(专题11)在解读科学研究和应用于科学教育方面有显著增长,尤其在20世纪90年代中期。同时,研究学生认知模式(主题18)和学生参与传统科学实践(主题19)的趋势也上升。这些主题相互关联,科学史与科学哲学的研究成果可能为其他两个主题提供了基础,促进了对学生学习和参与科学实践的研究。
(3) 从认知主义到社会文化框架的转变(主题 16、17、18 和 21)
教育心理学领域经历了从定量和认知主义向定性和社会文化方法的转变。20世纪70年代至90年代初,研究重点是学生心理和认知,以及定量方法。随后,认知模型与实践学习的结合(专题18)和身份与话语分析(专题21)的兴起,标志着对社会文化视角和定性方法的更多关注。
从认知主义框架到社会文化框架转变相关主题的流行图
4 讨论与局限性
本研究通过使用LDA技术,实现了对《科学教育》杂志所有文章的自动化主题分析,展示了大规模文献综述的潜力。研究不仅揭示了科学教育领域的最新趋势,还通过量化方法,将这些趋势以时间函数的形式展现出来,为科学教育研究提供了新的视角和方法论上的贡献。
通过可视化分析,我们揭示了教育研究主题随时间的趋势变化。例如,教师准备研究经历了从评估和标准到专业发展和职前教育的转变。同时,20世纪70年代出现了两次以学生为中心的研究浪潮,分别关注问题解决和学生兴趣动机。这些微观趋势和联系在大量文献和长时间跨度中难以被普通读者识别,但算法能有效区分。
分析表明,教育领域通过借鉴相邻学科的知识实现跨学科“异花授粉”,如定量方法与学生动机评估结合了教育心理学,问题解决研究融合了普通心理学。同时,科学-技术-社会研究、科学史与科学哲学等专题也受到社会科学、文化问题和批判理论的影响。社会文化关注的兴起部分归因于社会学和学习科学中的社会文化学习理论。
研究显示,未来科学教育领域可能因跨学科的相互影响而产生新的研究趋势。研究人员若能借鉴其他学科的知识和观点,将有助于提升科学教育研究质量,并可能推动研究重点的转变。为了更准确地理解和追踪这些跨学科互动,需要进一步的研究工作。
该分析揭示了科学教育领域的发展历程:20世纪70年前,研究侧重于学生成绩和教师准备的定量分析及教学理念讨论;70至90年代,探究式教学和科学教育的社会科学问题受到关注,研究转向学生认知和动机;此后,科学教育实践更加注重学生话语、概念理解和教师职业发展。
新进入科学教育领域的研究人员可利用期刊发展图来确定研究重点,避免重复前人工作。该分析有助于识别持久主题和新研究领域,指导学者关注特定时间段的文献。例如,心理学建构应用于科学教育的研究者可关注1970-1990年的文献。同时,期刊如《科学教育》可采用LDA推荐引擎,帮助学者发现相关作品。
近年来,STEM领域以及科学身份与话语分析等主题的研究兴趣显著增长,形成了强大的趋势。这种趋势表明,在未来几年甚至更长时间内,这些主题将继续吸引研究人员的关注,尤其是在美国当前的社会政治背景下。
LDA技术不仅适用于训练模型的文章分析,还能评估其他文献的主题流行度。初步测试显示,该模型能合理地分析不同主题的混合体,如《发明科学》一文中的认知模型、论证、科学史等,以及《科学为哪些公众服务?》一文中的科学-技术-社会问题、身份话语分析等。这些结果表明LDA在评估文献主题方面具有潜在价值。
植物学科学教育演变:左上19世纪,右上20世纪,下21世纪
局限性
对《科学教育》约一个世纪的出版史上所有撰写的文章进行了自动、定量的文献回顾和分类,揭示了该领域长期的研究主题和趋势,可发现科学教育领域几条经久不衰的研究线索,以及各种兴趣浪潮和科学教育领域从其他领域有效借鉴的证据。但分析结果受限于文献基础、模型算法和数据处理决策,不能完全代表客观真实。尽管如此,该技术有助于理解文献并预测主题趋势,但不建议替代人工解读。未来研究可扩展至多期刊数据集,探索更广泛的趋势,并应用于其他学术领域和文本定性研究。
未来的学习者将更加多样化
延伸阅读:
Odden TOB, Marin A & Rudolph JL (2021) How has Science Education changed over the last 100 years? An analysis using natural language processing. Science Education, 105, 653-680.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-11 20:45
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社