||
美国政府部门和学界讨论科技统计信息的透明度
武夷山
2022年5月,美国国家科学院出版社出版了一份研究报告,Transparency in Statistical Information for the National Center for Science and Engineering Statistics and All Federal Statistical Agencies (国家科学与工程统计研究中心和所有联邦统计机构都应关注统计信息透明度) 。该报告由4家单位联合完成:国家科学与工程统计研究中心“联邦统计信息之透明度与可再现性专家委员会”;国家统计委员会;国家研究理事会行为与社会科学及教育处;国家科学院、国家工程院和国家医学院联合体。
下面介绍报告的一点点内容。报告原文可免费下载。
无论是对于各级政府的政策制定者和项目管理者、私营部门的决策者、科研人员、媒体还是公众,值得信任的政府统计数据都是至关重要的。
在美国,有13个主要的政府统计部门以及其他部门的一些单位和项目在产生关键统计数据,其范围从科学与工程事业到教育和经济福利。联邦政府的所有统计工作是由预算管理局(OMB)的首席统计师和统计政策机构间委员会(ICSP)来协调的。
官方统计数据往往是复杂的数据收集、加工和估算方法的产物。有关机构在记录数据,用户在理解数据的时候,会觉得这些方法很难把握,因为它们本质上是不透明的。
本报告采用的“透明度”定义是:对于生成官方估计的整个过程,都要有足够详细的记录。
提高透明度的目标,是使得联邦统计数据的消费者(用户)能够精准地理解和评价相关估计是怎么产生的。
2019年5月,美国国家科学院出版社出版了一篇共识研究报告,Reproducibility and Replicability in Science(科学中的可再现性和可重复性,见我的博文https://blog.sciencenet.cn/blog-1557-1180218.html)。该报告提出,所有学科都应回答关于科研成果可靠性的四个问题,前三个问题是关于科技统计信息透明度的本报告也要回答的。这三个问题是:
1. 有关数据和分析是否具有足够的透明度和清晰度,从而有助于核查结果?
2. 如果核查结果,那么用于支撑结果的那些数据和分析真的能起到支撑作用吗?
3. 如果相关数据与分析被证明能够支撑结果,那么该结果能在特定的研究背景下重现吗?
在本报告中,要回答上述第一、第二个问题,就意味着要审视和应用来自政府统计机构的信息来核查统计机构发布的结果。这类研究——尤其是涉及数据分析(包括数据清洗、编辑和赋权)的研究——以及相关的计算机编码试图弄清,基于科研过程这些个阶段的已发布结果能否再现出来。
要回答上述第三个问题,就要在产生了官方原始估计的那个“特定的研究背景”下开展广泛得多的独立研究,这里的“背景”指全套的研究要素,从概念化到研究设计,再到数据收集、数据分析及发布。
考虑到这些研究将是很复杂、很昂贵的,本报告关于统计文档透明化的对策建议旨在敦促政府统计机构要使相关信息始终处于可资查找利用的状态,否则,相关研究根本无法完成。
最后,透明度还包括了“可发现性”。意思是,用户必须能很容易地找到关于现在和过去的统计项目、估计值集合和输入数据集的足够信息,既要了解这些信息的存在,还要评估其质量和适合使用的程度。
专家委员会的结论是,有效的统计机构应悦纳透明度理念,提供一些重要的信息,以表明统计机构能不受政治影响和其他不合适的外部影响之干扰,支持统计机构不断采用最先进的方法,对数据提供者给以尊重和保护。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 01:46
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社