图谋博客分享 http://blog.sciencenet.cn/u/libseeker 图谋,为图书馆学情报学谋,为图书情报事业谋。

博文

如何用数据说话?

已有 4913 次阅读 2019-3-29 10:59 |个人分类:圕人堂|系统分类:观点评述| 学术研究, 实证研究, 随笔

     数据是什么?有许许多多的定义,姑且采用《图书馆·情报与文献学名词》第一版中的定义:“数字、字母与符号的集合。系客观事物与主观思维的具体表达,不限于数值。现常指可由计算机处理的信息单元。”数据有定性的、定量的;有即时性的,有动态的;有描述性的、有统计性的;有一维的、多维的……说话是指什么?通常是指陈述事实或表达观点。用数据说话,主要是指用数据来支撑观点,做到有理有据。

    美国高校图书馆同行友人推荐我阅读一份美国教育部的报告,这是一份关于学术图书馆的统计报告,美国图书馆协会负责实施的。由此,引发一些感想,关于学术研究中如何用数据说话?

    国内也持续作类似统计工作,年年填报事实数据。参与情况不甚理想,数量角度,大约只有三分之一参与。从美国学术图书馆那份报告,可以感受到一些差异。美国的统计可能基础工作较为扎实,有标准规范可行,报告中那份问卷总体结构比较简洁,填报工作量不大。国内的情况很复杂,填报的内容也复杂,统计口径,填报人的个人理解因人而异,因此填报率底。美国的报告基本不涉及个体馆的“隐私”,国内的报告会曝光不少个体馆的信息。因此,有的馆有顾虑,填报时有意无意有所保留。

    根据我之前同美国同行打交道,有些信息,关系到个人利益,非常敏感。也就是说,原本都不同程度存在种种顾虑,但公开报告需对研究对象无害化处理,这样收集数据效果会更好。比如文献资源经费方面,有的馆投入很少(或者自认为很少),个体馆馆员乃至其所在学校觉得没面子。甚至有可能带来潜在的负面影响,比如一定程度影响生源竞争。人员结构或编制也会是敏感信息。有道是“没有比较就没有伤害”。美国一些公开的数据,基本上不涉及个体馆的信息。

    如何用数据说话?费思量。数据从哪来?谁来用?怎么用?用的怎么样?滋味杂陈。近年来,格外提倡实证研究,实证研究格外重视用数据说话,重视研究方法的规范性,以提升研究成果的实用价值。然而,常用的问卷调查法,不同程度存在“硬伤”,比如未进行严格概率抽样、样本的代表性不足等问题,少数大样本研究虽运用了概率抽样方法,但数据质量控制方面存在瑕疵。如果数据本身的“信度”与“效度”均是可疑的,那么研究结论无论多么“高大上”,也只是“形体美”,中看不中用。

    用数据说话的最高境界或许是:信、达、雅。套用严复先生提出的翻译要求和原则,“信”指准确无误,“达”指通顺畅达,“雅”指优美自然。




https://blog.sciencenet.cn/blog-213646-1170299.html

上一篇:图谋博客精粹将再次结集出版
下一篇:圕人堂周讯(总第255期 20190329)
收藏 IP: 210.28.40.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-24 09:46

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部