|||
数据是什么?有许许多多的定义,姑且采用《图书馆·情报与文献学名词》第一版中的定义:“数字、字母与符号的集合。系客观事物与主观思维的具体表达,不限于数值。现常指可由计算机处理的信息单元。”数据有定性的、定量的;有即时性的,有动态的;有描述性的、有统计性的;有一维的、多维的……说话是指什么?通常是指陈述事实或表达观点。用数据说话,主要是指用数据来支撑观点,做到有理有据。
美国高校图书馆同行友人推荐我阅读一份美国教育部的报告,这是一份关于学术图书馆的统计报告,美国图书馆协会负责实施的。由此,引发一些感想,关于学术研究中如何用数据说话?
国内也持续作类似统计工作,年年填报事实数据。参与情况不甚理想,数量角度,大约只有三分之一参与。从美国学术图书馆那份报告,可以感受到一些差异。美国的统计可能基础工作较为扎实,有标准规范可行,报告中那份问卷总体结构比较简洁,填报工作量不大。国内的情况很复杂,填报的内容也复杂,统计口径,填报人的个人理解因人而异,因此填报率底。美国的报告基本不涉及个体馆的“隐私”,国内的报告会曝光不少个体馆的信息。因此,有的馆有顾虑,填报时有意无意有所保留。
根据我之前同美国同行打交道,有些信息,关系到个人利益,非常敏感。也就是说,原本都不同程度存在种种顾虑,但公开报告需对研究对象无害化处理,这样收集数据效果会更好。比如文献资源经费方面,有的馆投入很少(或者自认为很少),个体馆馆员乃至其所在学校觉得没面子。甚至有可能带来潜在的负面影响,比如一定程度影响生源竞争。人员结构或编制也会是敏感信息。有道是“没有比较就没有伤害”。美国一些公开的数据,基本上不涉及个体馆的信息。
如何用数据说话?费思量。数据从哪来?谁来用?怎么用?用的怎么样?滋味杂陈。近年来,格外提倡实证研究,实证研究格外重视用数据说话,重视研究方法的规范性,以提升研究成果的实用价值。然而,常用的问卷调查法,不同程度存在“硬伤”,比如未进行严格概率抽样、样本的代表性不足等问题,少数大样本研究虽运用了概率抽样方法,但数据质量控制方面存在瑕疵。如果数据本身的“信度”与“效度”均是可疑的,那么研究结论无论多么“高大上”,也只是“形体美”,中看不中用。
用数据说话的最高境界或许是:信、达、雅。套用严复先生提出的翻译要求和原则,“信”指准确无误,“达”指通顺畅达,“雅”指优美自然。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 07:35
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社