|
说明:本博客与微信公众号“林墨”同步更新,所有内容均为原创,可授权转载请扫码关注“林墨”公众号。
研究和理解科学家研究兴趣的转移与演化具有重要意义。Nature HumanBehaviour上近期的一篇论文用“海滩游走”(seashore walk)模型解释其内在的演化规律与特性。
步一 / Indiana University
注:图片来源于参考文献中的论文
科学家像『海边捡贝壳的孩子』
牛顿说:在我的科学生涯中,我就像一个在海滩上玩的孩子一样,找啊找,最终找到了更美丽的贝壳。科学家研究兴趣的变化也大致如此。
科学家的研究兴趣并非一成不变的,而是随着社会变迁、技术进步、文化兴起而不断变化。例如,十年前,科学家的研究兴趣并不包括人工智能、大数据等。科学计量学中科学家“研究领域”的测度,主要使用以下几种方式:
· 使用文献关键词、题名、摘要或者全文进行自然语言分析;
· 使用主题建模方法;
· 使用数据库提供的分类号。
尽管以往存在一些研究,对于科学家研究兴趣的转移进行了一定的定量描述,但极少有文章使用大规模数据,以物理建模和拟合的方式,对科学家研究兴趣演化机制进行探讨。今年,Tao Jia教授等人在Nature Human Behaviour上发表了一篇论文在这一领域做了尝试。
科学家的职业生涯与研究兴趣
Tao Jia教授等人使用了美国物理学会(APS,AmericanPhysical Society)中含有物理学与天文学分类号的数据集。数据集包含了1976-2009年间发表的物理学领域的论文;这些论文的作者姓名已经由前人进行了消歧。
科学家在数据集中第一篇文章的发文年份被视为该科学家职业生涯的起点,而在数据集中最后一篇文章的发文年份则被定义为终点。作者首先选取了所有科学家职业生涯最开始的两篇和最末的两篇文章(m=2),然后获取这四篇文章在数据集中的分类号(同一篇文章可能被标记多个不同的分类号);作者用分类号的前两位代表论文所在的大类。随后,作者使用余弦相似度计算每位科学家职业生涯开始和结束时期的话题相似度。为了得到更具有鲁棒性的结果,作者尝试选取了不同的m值进行同样的计算,得到了类似的结果。这表明m值的选取对于实证结果整体影响不大。
科学家研究兴趣的变化
作者随后提出三种不同的特性来理解科学家职业生涯中研究兴趣的转移。
· 异质性(heterogeneity)强调,科学家在其职业生涯中发表的论文可能在研究话题上有所重复,但有些可能只出现一次。
· 新近效应(recency)则假设,科学家在研究过程中会尽量避免回到之前研究过的话题中,这导致他们倾向于探索更新的研究话题。
· 主题相近性(subject proximity)则认为,当科学家准备变换其研究话题时,他/她更可能选择和之前研究话题类似(但不是相同)的研究话题。
为了更好地探索这三种特性是否会潜在影响科学家研究领域的转移,作者使用了三种不同的方式建立了三种不同的对照模型。研究发现,这三种特性都影响着科学家研究兴趣的转移。其中,异质性和主题相近性起到了对现有研究领域深度挖掘和探索的作用,但新近效应则相反,它驱使科学家探索新的研究领域。
用『海滩游走』模型解释『为什么科学家的研究兴趣老变』
科学家寻找研究兴趣的过程与牛顿在海滩建筑贝壳的过程相似。因此,作者使用上图中的“海滩游走”(seashore walk)模型来解释科学家的研究兴趣的演化。在这一模型中,“海滩”上有某一数量的点,某些点上存在一定数量的贝壳,存在多种类型的贝壳,每种类型代表一种研究话题,贝壳数量在各点上的概率分布为P(q),有可能某些点上不存在任何种类的贝壳。科学家随机从“海滩”上选择一个点,然后向左或者向右随机行走,向左和向右的概率均为0.5;他(她)有可能在某些点上经过两次或两次以上;走到的点如果有贝壳,则代表发表了一篇某种研究话题的论文。科学家每走一步代表着一个单位的时间过去,他(她)所走的总步数等于其科学职业生涯包含的总时间(即数据集内最后一篇他的论文与最先一篇他的论文的时间之差)。作者成功拟合了实际数据。
Jia, T., Wang, D., & Szymanski, B. K.(2017).Quantifying patterns of research-interest evolution. Nature Human Behaviour, 1,0078.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-20 00:35
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社