武夷山分享 http://blog.sciencenet.cn/u/Wuyishan 中国科学技术发展战略研究院研究员;南京大学信息管理系博导

博文

一篇睡美人文献 精选

已有 19717 次阅读 2015-1-12 16:43 |个人分类:科学计量学研究|系统分类:科研笔记

一篇睡美人文献

武夷山

 

20141030日出版的《自然》杂志讨论了史上被引次数最高的100篇文献。列在第11位的是美国统计学家Edward KaplanPaul Meier发表于1958年第53J. Am. Stat. Assoc.(美国统计学会会刊)上的论文,这是一篇“睡美人”文献,发表后几乎没有什么人引用,直到20世纪70年代,由于计算机能力的增强,使得该文介绍的方法(被后人称为Kaplan-Meier法)连非专家都能掌握了。该方法简洁、易于使用,故引用者众。据学术谷歌,此文已被引用44,888次。

诸位同道在进行零被引研究时,可关注这篇典型文献。

 

下面的资料是网上找来的(http://www.empowerstats.com/manuals/empowerRCH/html/index.php?b=s6_km&m=):

Kaplan-Meier生存曲线

随访研究,如对 某人群进行跟踪,直至出现一个特殊事件或终点,如死亡、癌症复发等,对所有研究对象从某特定时间点开始追踪,记录出现特殊事件的时间。通常,当所有研究对象出现该事件时研究才结束,但也有些研究对象可能失访,或者研究提前结束,这样就有一些对象的结局未知,对这些对象记录跟踪的时间(截尾数据)。

Kaplan-Meier
生存曲线可以用来描述该人群的生存情况。

Kaplan-Meier
法是一种非参数方法,既适用于小样本,又适用于大样本。基本思想是:将生存时间由小到大依次排列,在每个死亡点上,计算其期初人数、死亡人数、死亡概率、生存概率和生存率。其思想与寿命表法相同。只不过寿命表法中时间段的划分是人为的、等距的,而Kaplan-Meier法划分时间段的分割点是实际死亡发生时间。

Kaplan-Meier
法的可用来
1
估计某研究因素 不同水平的中位生存时间。
2
比较该研究因素 不同水平的生存曲线有无差异。
3
控制一分层因素 后对研究因素不同水平的生存时间比较(此时将按分层因素的不同水平对研究因素对生存时间的影响分别进行分析)。


参考文献

Richanrd Van Noorden,Brendan Maher and Regina Nuzzo,The Top 100 Papers,Nature,30 Oct. 2014,550-553页


相关阅读

武夷山:千万不能忽视文献“睡美人”现象

论应提倡什么样的文献利用效益观

科学时报,2008-2-29


荡起双浆     作者:黄山 

科技文献对于整个科技工作起着基础保障作用。牛顿说,他之所以比前人看得更远,是因为站在巨人的肩膀上。如果科技文献工作做得不好,就意味着连巨人的肩膀都够不着。大型图书文献中心的科技文献收藏,则应该起战略保障作用,对于科技事业的作用不亚于石油战略储备对于国民经济的作用,不亚于粮食储备对于保障民生的作用。2006年12月27日我国台湾发生的地震,震断了敷设在太平洋底的几条通讯光缆,于是,我国内地很多网民无法访问国外网站。在相当一段时间里,只订购了国外网络版全文期刊的很多图书馆就无法提供外文期刊文献了。结果,2007年,以收藏纸本科技期刊为主的国家科技图书文献中心各成员单位收到的全文文献请求量剧增。这一偶发事件充分表明了科技文献战略保障的重要性。
 
无论干什么,都要讲效益。对于提供科技文献战略保障的大型图书文献中心来说,应该有什么样的文献利用效益观呢?通常,文献利用主要表现在:网络版文献被下载;纸本文献被复印;提供开架阅览的图书馆书架上的书刊被到馆读者取阅;书刊被借出(包括馆际互借),等等。于是,一些图书馆就根据这类文献使用数据来考察哪些书刊的利用效率较高,哪些资料的利用效率较低(甚至从来无人问津),并随之作出图书剔旧、期刊停订等决策。这种基于数据的做法是有道理的。但是,从科技文献战略保障的角度说,仅仅根据文献的短期利用数据来作图书馆采编决策又是远远不够的。这是因为,第一,用户往往自己事先也不知道到底需要哪个年代的文献;第二,科学计量学上有所谓“睡美人”现象。该现象指的是,长期无人引用的论文突然被引用,然后引致大量引用, 好比睡美人终于苏醒了一样。
 
有句话说得好:阳光底下无新鲜事。前人从来没有进行过研究、从来没有作出若干有价值的思考的领域或主题是极少的,只是今人不一定知道罢了。因此,重视文献的价值,透彻了解前人做了什么,有哪些经验教训,对科研非常重要。到底要追溯到多早的文献,在文献查询开始之前谁也说不清楚。中科院化学所研究员王鸿飞前不久在其博客上说,有一次,他觉得他的研究生测量到的一个单分子膜的界面相图和人们通常理解的不太一样。于是这个学生要再重复几次实验看看是不是做错了。王鸿飞则说,还是先查一查文献或教科书上有没有类似的测量。于是,他们花了10分钟在一本1966年出版的专著上找到了答案。接着,他们又找到了那本专著所引用数据的原始文献,那是1942年的一篇《美国化学会志》上的文章,其中报道了相关的特殊现象,并且对其原因提供了一些很有意思的推测。最有意思的是,王鸿飞和学生们的数据正好为那些猜测提供了更多证据。王鸿飞感慨地说:“依靠前人的文献,不一会儿就解决了上面的问题,还有新发现,避免了不必要的重复实验。这说明学术研究是极具传承性的事业,任何一个研究者要取得好的进展,都不能是一个人在战斗。”也许很多人认为,科学发展日新月异,突飞猛进,几年前的成果恐怕很快就过时了。而上述事例表明,只要善于利用,几十年前的文献仍有价值。我们中国科学技术信息研究所是国家工程技术图书馆(国家科技图书文献中心成员单位之一)总馆所在。多年来,有很多科研人员特意到这里来查阅早期的文献,尤其是20世纪70年代的文献。他们深知山不在高,有仙则名;文献不在新,有启发就行。
 
现在,大家都很注意用论文被引用数据来反映论文作者的水平,反映论文的价值,进而反映登载论文的期刊的价值。这是一个好现象。但是,千万不能忽视文献“睡美人”现象。最典型的例子是,L J Romans发表于1986年《物理学快报》上的关于超引力的论文,到1995年才被《物理评论快报》所引用,随后出现引用高峰。如果我们在文献收藏上短视的话,等“睡美人”文献苏醒之时,恐怕已经找不到这些文献了。
 
应当承认,在文献收藏管理方面的短视行为在国内图书情报机构还较普遍地存在着,部分原因是,某些领导在考察图书情报机构的业绩时太看重近期的数据。既然我们要建设创新型国家,要突出自主创新的地位,就必须有坚实的科技文献战略保障。否则,这些宏伟蓝图就难以实现。在建立科技文献战略保障的过程中,对于文献的价值和文献利用效益,一定要从长计议!(作者为中国科学技术信息研究所研究员)
 






https://blog.sciencenet.cn/blog-1557-858792.html

上一篇:学术报告预报:构架面向大数据的天地人网的情报分析系统
下一篇:日记摘抄(110)----身体不适,同学相助
收藏 IP: 219.142.241.*| 热度|

58 王德华 蔣勁松 徐传胜 杨正瓴 刘立 姬扬 文克玲 蔡小宁 徐晓 薛宇 罗帆 孙学军 曹家鑫 余国志 黄永义 谢力 张忆文 罗德海 李伟钢 李天成 刘全慧 蒋国华 赵保明 陈湘明 廖晓琳 邵鹏 陈晨星 魏瑞斌 程娟 平果 曹俊 章成志 范毅方 庄世宇 钟炳 杨金波 金义光 王桂颖 罗会仟 黄育和 喻海良 刘俊伟 苏光松 王号 陈钢 许培扬 赵美娣 刘淼 梁洪泽 俞立平 周春雷 强涛 qzw HLpope zjzhaokeqin chenhuansheng biofans yunmu

该博文允许注册用户评论 请点击登录 评论 (22 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 05:14

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部