|||
飞速发展的医学科研催生了海量科研成果的诞生,全球23,000余种生物医学期刊,每年可发表百万篇文献。然而教科书与专著的更新速度,却远远落后于科研成果的产生。
每个医生,需365天每天阅读19篇文献,才能跟上本领域的学术进展。如何慎重地将研究中最新、最佳的证据运用于临床?循证医学证据等级与评价系统应运而生。
评价之前:证据的分类
证据的分类有多种维度。如果按照研究方法,临床研究证据有原始与二次数据之分。原始数据为直接从受试者获得的第一手数据,以及经统计分析后的结论;而二次数据为对多个原始研究再加工后得到的证据。同时,还存在非研究证据,包括专家意见、个人经验、其他(当地「智慧」、「诀窍」、「常识」等)。
溯本清源:证据分级的起源
20世纪60年代,美国两位社会科学家Campbell和Stanley首次提出了研究证据分级的思想,并引入了「内部真实性」和「外部真实性」的概念:
内部真实性
你研究的结果针对你研究的样本符合得好不好;
试验设计和实施消除偏倚的程度;
评价研究的误差大小。
外部真实性
你的研究结果能否推广到研究样本以外的人;
结果在目标人群及实践中,能够重复再现的程度;
高内部真实性的研究,是探讨外部真实性的前提。
1972年,英国医生Archie Cochrane的经典著作《疗效与效益:健康服务中的随机反映》唤起了人们对医学决策科学性的深刻反思。1979年,加拿大定期体检特别工作组(CTFPHE)首次对研究证据进行了分级,并给出了推荐意见。
此后20余年中,世界多个机构组织对证据质量与推荐强度进行了规范,但方法各异、标准不一,甚至彼此矛盾。
各种评价系统点评
诸多系统中,CTFPHE与ACCP标准有着奠基者的地位。两系统均产生于20世纪70-80年代,当时正是国际流行病学和卫生技术评估方兴未艾、医学继续教育空前繁荣的时代。加拿大研究者首次明确提出,研究证据优于专家意见,这成为后来诞生的循证医学的基本理念之一。
1992年AHRQ制定的标准中,将随机对照试验的Meta分析作为最高级别证据,并向全国推广。1996年,NEEBGDP发布了证据分级标准与推荐强度,将RCT、Meta分析和系统评价共同作为最高级别证据。
2001年,SIGN发布了更详细的证据分级和推荐强度。随后几年里,荷兰、新西兰、澳大利亚等过也先后在临床指南中引入或修订了各自的证据分级与推荐标准。
老五级、新五级与新九级证据
GRADE标准横空出世:里程碑式事件
历史上从不缺乏证据分级标准,只存在诸多标准良莠不齐的局面。2000年,包括WHO在内的19个国家与国际组织共同创立了GRADE工作组,由67名专家、各标准主要制定者等构成,于2004年正式推出了国际统一的证据质量分级与推荐强度系统,从此GRADE标准一统江山,包括WHO与Cochrane协作网在内的28个国际组织、协会已采用GRADE标准。
GRADE标准的优势
权威--由具有广泛代表性的国际指南定制小组制定;
明晰--明确界定了证据质量与推荐强度,清楚评价了治疗方案的结局;
合理--对不同级别证据的升降级有明确、综合的标准;
透明--从证据到推荐全程透明;
人性--承认价值观与意愿;
全面--就推荐意见强弱,分别从医生、患者、政策制定者角度做出诠释;
灵活--适用于系统评价、卫生技术评估、指南制定。
小结:大势所趋,止于至善
证据分级与推荐强度的发展,是历史的必然。从定性到定量(单个RCT到多个RCT的Meta分析),从局部到整体(只考虑试验设计到考虑研究质量、内外部真实性等),从个别到一般(临床、预防到基础、管理),从分散到统一(各自为政到全球统一),证据分级标准的车轮从未停歇,也仍将继续在实践中不断修正、超越。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-30 13:26
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社