氢分子医学分享 http://blog.sciencenet.cn/u/孙学军 对氢气生物学效应感兴趣者。可合作研究:sunxjk@hotmail.com 微信 hydrogen_thinker

博文

学者热议如何提高临床前研究的重现性

已有 3993 次阅读 2015-4-19 11:35 |个人分类:自然科学|系统分类:海外观察

科学具有自我纠错能力,但这一原理在动物实验研究方面遭受打击,这一问题已受到科学家和民众的广泛关注,促使NIH为纠正这一问题建立新的指导原则。学术不端肯定是导致这一问题的一个因素,估计有大量造假论文在海量论文掩护下顺利发表。自从去年NIH倡议采取各种措施解决这个问题以来,尤其是发布“NIH重复研究指南”,是否有成效不清楚,有一些学术期刊支持,也有一些学术期刊认为这个指南增加了工作的复杂性,而且没有什么价值,让他们的杂志在吸收高水平论文方面受到影响。最近《自然》对这一问题进行了报道。

NIH推荐的指南是20149月发布的,该指南包括:对重要研究数据提供准确全面的描述,例如对实验使用细胞系、动物、抗体和试剂等信息。作者必须描述实验的关键步骤是否采用了盲法或随机化设计。


上周美国实验生物学联合会FASEB主席Joseph Haywood率先发飙,在给NIH首席代表Lawrence Tabak.的电子邮件中提出,这种一刀切的老什子指南应该废除。FASEB拥有27个学会、12万会员和62份学术期刊。Haywood认为指南对作者准备稿件、投稿、审阅稿件等过程造成负担,核对表等要求使许多作者知难而退,让杂志错失一些高水平审稿人。

加拿大美吉尔大学生物医学伦理学家Jonathan Kimmelman认为,盲法和随机化和控制样本量等研究设计不一定完美,也可以通过其他方法解决一些问题,尤其是对一些具有探索性的研究,这些研究并不是只为解决临床疾病服务的。NIH的指南并没有提供实验设计的指南,只是要求增加实验方法方面的透明度。

FASEB科学政策主任 Yvette Seger提出,FASEB成员担心,这种规定会导致人们过于屈服于形式,科学家更应该专注于科学问题本身,而不是一些繁文缛节的规定和指南。这些指南执行的尺度标准不统一也是问题。另外,到底那些研究属于临床前研究也没有统一说法。FASEB也认为应该采取行动来提高研究可重复性,对NIH在这方面的努力也表示感谢,但对这个问题应该与科学界有更多的沟通,不能一意孤行。20147月,NIH在一次30多家高档学术期刊编辑培训班(CNS悉数到场)发布了指南。

80多家,包括FASEB旗下的3家学术期刊支持NIH的指南。但更多期刊没有跟进。美国化学学会和英国皇家学会期刊决定不支持。他们认为自己有针对研究可重复性的标准。细胞出版集团旗下的《生物化学杂志》上周发表文章说,他们对NIH指南的意图非常认同,但是他们认为自己的杂志不适合这个标准。PNAS也一直在考虑是否接受这个指南。

NIH首席代表Tabak说,他鼓励期刊使用NIH的指南,他已经看到该指南对改进科学文献质量的作用。期刊自己制定一系列为提高透明度和再现性的指导原则的做法应该鼓励(不愿意一起玩,搞自己的标准也一样)。他说,发布的指南只是一个版本,可能会存在不足,将来会有不断进行修改。学会的来信值得表扬,这说明大家都在关注、考虑这一问题,这是好事。

 Journalof Cerebral Blood Flow and Metabolism《脑血流和新陈代谢杂志》主编,柏林查利特医科大学神经学家Ulrich Dirnagl教授认为,在提高研究结果可重复性方面,期刊的作用是相对比较小,必须有从事研究学者们的主动,经费资助机构也要积极重视

宾夕法尼亚州TetraLogic制药公司首席科学官Glenn Begley认为,科学家内心的标准才是最重要的。如果只是一场关于研究文件规范的检查运动,而没有从良好科学方法和理念基础上的改进,那么将是非常失败的形式主义。

人类临床试验要求比较高的可重复性。临床研究在设计和独立监督方面有非常严格的制度,如必须遵守随机、双盲、样本量估计、效果标准化分析和数据公开注册等规范。一些临床试验组织甚至还采用了标准报告规范。

但是临床前研究,特别是动物实验研究的情况就大不一样。动物实验研究甚至已经堕落为结果难以重复的重灾区。许多冠冕堂皇的理由是苍白的,如动物种属、实验环境、实验方案不同。结果无法重复可能是由于统计学误差和发表偏倚导致。另一个陷阱是所谓的“假说驱动”实验,就是所谓围绕研究目标拼凑实验证据,过度解读研究意义,甚至故意忽略阴性结果的严重问题。

根据美国NIH的说法,除故意学术不端以外,导致研究结果无法重复的原因主要有三个方面的因素,研究人员、政府和学术机构和出版机构都存在这样那样的问题。

首先是来自科研人员的主观和客观因素,例如有科研人员的水平问题,在科研设计和严谨性方面的不足,发表论文的物质诱惑导致草率发表证据不全的研究结果,研究过程忽略实验设计细节,如单双盲、随机、重复、样本数量和性别等因素都可能影响到实验结果可靠性。

其次是来自学术期刊因素,学术期刊对实验设计不严格,学术期刊不愿意接受学者的阴性研究结果,都是导致结果难以重复的原因。

政府资助机构和学术机构的态度也是重要外部因素,这些机构不加鉴别地鼓励学者在高影响杂志上发表论文。为达到目的,学术机构采用职位、实验平台支持甚至金钱进行鼓励。

作为资助机构,NIH设法克服这一问题。考虑到实验设计培训薄弱的问题,NIH对研究人员进行结果重复性和透明度的培训,重点培训课题设计能力。该培训项目已经纳入NIH博士后培养计划。在基金评审方面,NIH提倡使用实验设计核对表,提醒对研究设计进行系统性评估。检查核对内容包括实验设计合理性、数据搜集和分析随机性、以及是否按照盲法原则等。在开展临床研究前,首先要对临床前研究进行独立验证,以减少无法重复带来投入失败。

NIH也将努力提高研究数据透明度,不仅要求发表论文的数据公开,而且要建立未发表数据和原始数据库。如有学者使用了这些数据并构成引用,可依据这些信息建立新的不依赖论文发表的学术贡献评价体系。如果相关技术开发顺利,新系统将在20149月投入运行。

研究结果可重复性不仅是NIH的问题。也涉及公众、出版商、大学、企业、职业团体、专利宣传组织等。尤其是学术期刊,应该鼓励发表阴性结果和对过去研究纠正的研究。一些杂志已经在这方面作出了表率。例如《自然》集团20135月声明,废除对研究方法部分篇幅的限制,以确保作者对关键技术方法的详细描述。作者使用编辑和评审人核对菜单以对实验设计进行评估。编辑对统计分析的评价主要依靠统计学家的帮助。同时鼓励作者在线提交更多支持论文的原始数据。在美国神经功能异常和中风研究所要求提高研究数据透明度的基础上,《科学转化医学》和《科学》杂志也相继提出了和《自然》类似的规定。

更棘手的问题是学术激励制度。因过分强调在高影响杂志上发表论文,部分原因无疑和研究经费紧张,各学术机构无奈鼓励学者尽快发表成果,这显然会影响研究结果的可重复性。为克服这个问题,NIH考虑修改其简历格式,要求基金申请人对研究具体贡献进行描述,并分析这些贡献在申请项目中的作用。霍华德休斯医学研究所曾经采用这种格式,发现这比传统的论文列表更能全面客观体现出申请人的实际贡献。NIH还在考虑调整经费资助模式和周期,以给学者提供更稳定的研究支持,降低经费申请的竞争压力,鼓励进行更大灵活性更长周期的研究项目。另外,目前的项目申请所有申请人的信息都暴露无遗,这可能会导致一些偏见,NIH正在尝试采用匿名评审以克服这些影响。

单纯依靠NIH不可能完全改善现在不健康的科研环境,如大学的职称晋升委员会也必须主动抵制采用懒惰不恰当的方式代替同行评议,特别是不能简单使用期刊影响因子和论文数量作为学术贡献和未来学术潜力的评价依据。

众多学术期刊存在研究结果不可重复的论文现象,要求大家必须立刻采取切实行动,NIH坚决开展系统改革以减少这种事态的扩大,但最终成功必须依靠所有相关人员的共同努力。




https://blog.sciencenet.cn/blog-41174-883587.html

上一篇:电子药物闪亮登场
下一篇:自然子刊:揭秘传统中药的抗心衰效应
收藏 IP: 58.247.243.*| 热度|

1 divingmed

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 22:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部