|||
Eugene Garfield,不仅仅是SCI之父,还是搜索引擎的祖父
朦朦胧胧中,好像听说过,科学引文索引(SCI, Science Citation Index)和Google有什么关系。应该不是我的直觉,但又不确定到底从谁那里听说的,或者看到的。
最近因为工作需要,就尝试着找找依据去确认一下。
查呀查,最终整理一下相关事实如下:
SCI的原理,本质上就三句话:一篇文章引用了谁,被谁引用了,还有哪些文章和这篇文章拥有相同的参考文章。这些在SCI数据库中分别称之为参考文献、施引文献和相关记录。SCI最最原始的用途,就是揭示研究成果与成果之间的关联关系。关于SCI的原理,请查阅SCI之父Eugene Garfield先生1955年发表在Science上的论文:Citation indexes for science: A new dimension throughassociation of ideas,此文被SCI数据库收录,入藏号:WOS:000241429200003。
Google起家,靠的是PageRank算法。PageRank算法的核心思想是:如果一个网页被很多其他网页链接到的话说明这个网页比较重要,也就是PageRank值会相对较高;如果一个PageRank值很高的网页链接到一个其他的网页,那么被链接到的网页的PageRank值会相应地因此而提高。关于PageRank算法,目前追溯到的是系列专利,第一篇就是Google创始人之一的Larry Page(专利原文显示为Page Lawrence)申请的: Method for node ranking in a linkeddatabase,此专利被Derwent世界专利索引收录,入藏号:2001-595486。当然,这时他还是斯坦福大学的学生,专利权归斯坦福大学所有。这篇专利引用的非专利文献(这是美国的专利审查员在进行专利审查时增加的)中,并没有Eugene Garfield 先生1955年发表在Science上的那篇论文,但引用了Eugene Garfield先生1972年发表在Science上的另一篇论文:CITATION ANALYSIS AS A TOOL IN JOURNAL EVALUATION - JOURNALSCAN BE RANKED BY FREQUENCY AND IMPACT OF CITATIONS FOR SCIENCE POLICY STUDIES,此文也被SCI数据库收录,入藏号:WOS:A1972N831000009。当然,后一篇论文和前一篇存在很强的关联。
查到最后,干脆直接看看此前是否有人研究过SCI与Google之间的关系。结果,最直接的一篇文章是:EUGENE GARFIELD, FRANCISNARIN, AND PAGERANK: THE THEORETICAL BASES OF THE GOOGLE SEARCH ENGINE ,https://arxiv.org/ftp/arxiv/papers/1312/1312.3872.pdf。文章的结论就是:Garfield’s theory of citation indexing andPageRank validate each other, and Eugene Garfield is the grandfather of the Websearch engine. 文章洋洋洒洒42页,论据非常充分的。人家是学者,我是打酱油的。
至此,一定意义上可以说:Eugene Garfield,不仅仅是SCI之父,还是搜索引擎的祖父!
感兴趣的老师和同学,可以查阅上述文献仔细研究。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 23:25
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社