里瑟琦智库分享 http://blog.sciencenet.cn/u/idmresearch

博文

大学排名背后的数据逻辑

已有 2992 次阅读 2016-3-15 08:49 |个人分类:大学排名|系统分类:观点评述| 中国, style, 微软雅黑, 大学排名, 非官方

当前众多的大学排名,大都是由非官方机构针对中国甚至世界范围内大学、研究机构等,进行各类数据进行统计、比较、分析,得出有关结果进行排名,最后发布,进行系列大学/研究机构的排名。笔者借鉴从数据来源、分类收集整理、综合分析到实现信息的有效化过程,通过分析数据—信息的转换过程,表现大学/研究机构的盛衰变化,“虽不中亦不远矣”,试图进行分析大学排名主要的依据——数据及其价值。

 

一、从数据到信息

根据情报学的概念描述,数据的基本属性是形式,主要在于反映客观事物运动状态,最终形成文本、数字、事实或图像等形式,在初始意义上它属于最原始的记录符号,客观反映了事物的生存及转化状态。而大学排行榜所涉及的数据及其覆盖的领域,集中反映了人们对于大学/科研机构的认识,但是从本质上说,这些数据本身是松散的,非体系化的,数据单元之间没有必然联系。一旦经过数据的收集与整理,尽管可能未经体系化,但是这个被外界所获知的过程前后,数据单元之间已有或多或少的关联,或具有逻辑上的或然联系,这种具有关联性或或然性联系的数据单元,构成若干数据的集合,转变为反映客观世界的有效信息,由形式化的单元转换为具有反映实质内容的集合,即为数据的关联性,笔者将其定义为“数据串”,就是一串有意义的数据,可以用于一定的用途和相当的价值。

由松散化到集合化,形成“数据串”,从而可以为公众获知,形成对大学/研究机构的基本认知和价值判断,这是从数据到信息的基本路径之一。

 

二、数据/信息的分类与来源

1983年美国率先推出全美的大学排名,1987年,中国第一个大学排行榜——艾瑞深中国校友会网大学排行榜发布,至今已有30年的历史。目前,已知的大学排行榜已达600多个,数据采集、指标体系、评价标准及结果之多,令人目不暇给。令人无法拒绝的一个后果就是,如今众多的大学排行榜构成的庞大信息网络,已经逐渐凸显其在中国高等教育领域重要性的关键位置,甚至成为不可或缺的部分,其涉及到的众多数据、信息纷繁复杂,基本为民间行为,非国家官方数据,数据信息的分类问题及权威和公信力问题也就随之而来。

首先,数据分类问题。大学排行榜内容涉及到的领域大致有教学、科研、人员、国际化等方面,有可测度的硬性指标和难以测度的软性指标,硬性指标如学生教工人数、出版物数量等,相对容易获取,也相对客观和精确,软性指标如声誉、影响力方面,需要通过一些有选择性的专家或其他人员,对其进行评价分析,从而得出评价分析结果。此类结果虽经过加权等数理分析,但本质上属于价值判断,主观性较强,不具备强权威性,但对于受众的心理定位与预期有较大影响。

其次,数据/信息的来源。数据的来源有不少公开获取的渠道,亦有专业机构提供的信息,也有高校或研究机构自身的提供的数据,也有排名机构自己构建数据库等等,来源不一而足。

公开可获取的方面大致有四种渠道:

1.互联网、公开出版物等,部分数据不够准确、完备,甚至是错误的,因此此类数据的客观性、权威性经常受到大众的质疑,公信力不够强。

2.来自众多数据库,如WoS、Scopus、知网等,涉及众多的数据供应商及出版商,此类数据可靠性较高,具有一定的权威性,但涉及的领域较少,主要体现科学研究领域的内容,因此虽具有权威性但不够全面。

3.众多高校和科研机构等信息提供方,他们会根据需求,提供有关数据,此类数据相对客观、真实、有效,更有说服力和权威性,但部分信息公开的程度及规范化等方面有待提高。

4.“自建数据库”数据,信息来源可能不够公开和透明,学界未必认可,因此评价结果可能会缺乏公信力和权威性从而引发质疑等弊端。

后三种数据来源渠道,相对于互联网和公开出版物,属于非公开或非常规获得数据的渠道来源,因此对于数据的公开程度及规范化方面,可能需要进一步提升。

最后,对于如何整合散碎而复杂的数据单元,即实现数据采集的合理性与合法性,从中萃取精华,显得更有挑战意义。

 

三、小结

数据单元的杂乱无章,只具备单纯的形式属性,无法实现“自组织”,数据只有通过可靠的实现路径,即方法、手段、实效等方面,成功向信息转化,才能获得有效价值,提高应用和使用。值得注意的是,需要认真审视数据来源及获取的合理性,提高数据转化为信息,提升其有效价值,并使之具有相当公信力,数据来源的合理、合规与合法具有更原始的意义。

对于大学评价与排名而言,甚至对排名进行研究,要审视数据信息的本质意义,如何对已获得的数据进行有效加工使之更具价值,不会造成数据有效性的流失,将松散的数据单元变成有序化、系统化、集约化,从而发现数据之间的规律,发现数据集成以后的“数据串”背后的“秘密”,获取“数据串”所体现的独特价值。正是这些独特价值的重要意义,从而为中国高校的科学管理提供理论支撑和科学经验。

 

(作者:宋金宁,南开大学)

https://blog.sciencenet.cn/blog-2903646-962679.html

上一篇:大陆高校健康学领域的科研产出亟待加强
下一篇:2016年专业怎么选? ——主管部门专业审批结果反映人才需求变化
收藏 IP: 180.160.11.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 20:19

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部