图谋博客分享 http://blog.sciencenet.cn/u/libseeker 图谋,为图书馆学情报学谋,为图书情报事业谋。

博文

关于高校数据库利用统计的思考

已有 2602 次阅读 2023-2-16 17:30 |个人分类:圕人堂|系统分类:观点评述

    自2015年开始,每年需要撰写“数字资源采购与利用情况报告”,这个报告需要花大量时间和精力。因此,有观察有思考,稍事梳理。

    这个报告大致包括3方面内容:数字资源采购情况;数字资源利用情况;简要分析。每年需要做两次,一次是年度总结时需要(通常每年12月进行,有些数据库统计存在1-2个月滞后,也就是数据不够完整),一次是校图书馆工作委员会汇报上一年的工作及下一年的计划(预算)时需要。实际还有其它场合需要,比如填报教育部高校图工委事实数据等场合需要。每年至少两次要求相关数据库商提供使用报告,对于重点关注数据库可能会更为频繁。几种重点中外文数据库,实际是有相关统计模块的,属于永远的Beta版,有的做得很好,有的“仅供参考”。高校图书馆数字资源采购联盟(DRAA)网站有利用统计模块,有保持较为密切的关注。此外,更高校图书馆以不同形式公开部分数据,亦有所关注。总的目标是:立足自身实际,知己知彼,追求尽可能全面、客观、准确掌握实际情况,并积极采取措施,以期更好地物尽其用。

    种种原因,相关工作要做好,背后是很不容易的。所在机构购买的数据库并不算多,但亦有数十种,每一种均有或繁或简的报告,均是个性化的,要“恰如其分”的总结与分析并不容易。有些数据需要透过表象看实质。表里不一是多见的、常见的。各个机构各有各的实际,校情馆情,办学层次、办学规模、发展阶段等存在很大差异。

    高校图书馆电子资源购置费的离散程度大,馆际差别明显,而且差距正在逐年增大。2022年共有1237所高校图书馆提交了有效的2021年电子资源购置费,总经费约为41.68亿元(2020年是39.21亿元),均值为337万元(2020年是343.6万元)。中位值落在排名第619名的南昌师范学院图书馆的数值,为101.3万元(2020年是105.38万元),较2020年降低约4.08万元。标准差为563万元,最小值仅为3000元,最大值达到4775.4万元。电子资源购置费排名前5的高校图书馆是:上海交通大学图书馆,4775.4万元(2020年是5188.2万元);清华大学图书馆,4742.4 万元 (2020年是4885.8万元);中国人民大学图书馆,4506.1万元(2020年是3138.7万元);中国科学技术大学图书馆,3799.9万元(2020年是3592.7万元);浙江大学图书馆,3362.5万元(2020年是3219.8万元)。(信息来源:吴汉华,王波.2021年中国高校图书馆基本统计数据分析[J].大学图书馆学报,2022,40(06):42-49.)所在机构数字资源购置费略高于平均数(2021年实际支出为386.8619万元)。

    某相对较为小众但价格不菲的外文数据库的定价策略与全文下载量密切相关。所在机构属于“新用户”(2021年7月15日开始采购),当前处于T6级。高校图书馆数字资源采购联盟中的分级标准,全文下载量是指用户2019-2021年期间的平均下载量。中途加入的按实际加入有效月份折算平均用量。 该数据库根据DRAA统计,全国地区IEL数据库同级别(T6),2021年全年用量平均值为8327篇,所在机构用量为10020篇,大大超过该平均值。参照DRAA集团采购方案(2022.11.30-2023.12.31)分级标准:T6级全文下载量为12000;T5级为12000-31199。T5级比T6级需多花7184美元。全国用户划分为6个级别:T1级,67.2万以上;T6级小于1.2万。上海交大、清华大学等13所高校为T1级,年使用费17万美元;T6级年使用费7.5万美元。2022年使用量有大幅提升,学校用户基数逐步上升,用户活跃度也逐渐变高,已经成为了学校相关领域师生做科研和课题得力工具之一。曾经有领导以为该数据库利用情况“不值得”,而且该数据库中的论文产出方面已经初见成效,实际算是使用情况良好。某电子图书数据库合同期(2021.6.25-2022.6.25),2021.6.15-12.31下载量为15262,2022.1.1-9.25下载量为28821。累计下载量为44083,2.83元每次下载。根据笔者掌握的情况,其实这个数据库的利用情况也算是不错的,但由于受经费限制,必须有所取舍。

    近年,新教师较多,多毕业于办学层次更高、办学条件更好的高校。常见的困惑是:为什么我校没有某某数据库?还有一个常见问题是,我有渠道用更多资源与服务,那些渠道通常是“灰色的”,实际上背后是有人买单的。比如个人账号泄露或主动提供给他人使用,其所在机构实际是需要为此买单的。有的行为,影响微小,有的很大。事例中的外文数据库的情况便是比较直观的例子。某机构买了,本机构用户用的不多,外机构用的多,那就是“为他人做嫁衣“(通常是无意的或者说没有察觉到)。

    分享上述信息主要的目的:一是希望有助于高校师生增进了解,更好地关注与利用图书馆资源与服务;二是希望有助于各界增进对高校图书馆专业馆员的理解与支持。

   延伸阅读:    

王启云.关于高校数据库绩效评价的思考.https://blog.sciencenet.cn/blog-213646-1368715.html

数字资源建设不仅仅是经费问题,更是水平问题。数据库绩效评价工作很重要,是采购的辅助依据。

           




https://blog.sciencenet.cn/blog-213646-1376535.html

上一篇:自然指数收录文章如何获取全文?
下一篇:关于高校图书馆人力资源的思考
收藏 IP: 61.132.1.*| 热度|

2 杨正瓴 郑永军

该博文允许注册用户评论 请点击登录 评论 (8 个评论)

IP: 114.237.166.*   回复 | 赞 +1 [8]王启云   2023-12-3 19:57
2023年12月3日圕人堂群叮咚评论(@麦子):
国内也是联合采购,但是具体效果感觉不是很明显。我在另一个群里说过:出版社OA比例越来越高,这头收作者的APC,另一头仍然每年涨价,所以感觉联合采购的谈判力度还不够。
国内的数据库绝大多数不支持标准的统计数据,如果图书馆非得要的话,数据库商可以甩过来几行数字,数据一看就是修饰过的。
另外我感觉国外的出版社或者信息服务商已经吃透了国内的采购规则,制订的销售方案滴水不漏,即使想省钱,也是在他们的销售框架下节省一点点。
IP: 114.237.166.*   回复 | 赞 +1 [7]王启云   2023-12-3 17:06
2023年12月3日麦子评论(续):
再好再有用的东西,一定要使用方便,否则没用。我是绝对不碰单反的,因为这对我来说就是个废物,因为我不可能拿这个东西出去玩的。
加一句,我们用似乎是末位除名的办法,就是不断加新内容,剔除不使用的内容。在纸本时代,这涉及存储空间照明空调人员的支持,但在电子时代往往就是钱:CPU。我们是永远处于没钱的处境,所以如果只增不减,这就没法持续。不过我们只要满足读者的需求,其他的事情就无所谓了。
IP: 114.237.166.*   回复 | 赞 +1 [6]王启云   2023-12-3 17:05
2023年12月3日麦子评论:
这篇东西不错。这里面的举名的馆电子资源的费用实在有点高。换成美元,基本和我馆当年全部的资源开支还要大,但这些学校在的排名和总资源拥有量是比不上我馆的。这是有多种原因造成的:

国内这类的馆的很多资源都是单独和数据商谈判买的,价格很难下来(我们大多数是联盟的,最低的标准是3家联合)。

买了很多似乎是觉得到了这个级别的学校该有,但实际上并不需要的东西。这点是很要命的,也多少和穷人思维有关。我遇到几个联合购买的例子:我有一个东西,觉得绝对是人人都要的,但到了后来,只有几家相应,原来想是必然会热烈响应的Berkeley, UCLA说没兴趣,尽管这对他们来说是很小的钱。另外,我有一些资源即使是哈佛也没有。

最后就是对COUNTER数据的使用,这东西对我们什么统计数据,做评估什么的没什么用,因为我们不做这些,最大的用处是比较使用情况,尤其是看需要续订的期刊。我们每年都做这个事情,就是看哪些期刊使用比较少。钱有结余时,标准订得松一点,否则就严一点,而且,这个停订的过程基本完全是由负责的馆员决定(我们三个人负责所有的学科,除了医学,这是另外一个话题,如果有人有兴趣)。万一有读者投诉,我们会告诉原因说服。如果实在谈不下来,大不了我明年续订,但这往往已经省了几百块。

我一直觉得,越是有钱的,其实越是有机会省钱,而很多省钱的角度和办法对没钱的是没用的。另外大钱有时是刚需,是不能省的,比如那个爱什么的数据库对一些学校来说,省了,你也就歇菜吧。当然,公共馆去弄一个就没必要了。最后,苍蝇肉也是肉,因为真的能省出来的往往是很多很细小的东西上,不过能不能省,需要很好的规划和很好的技术手段,比如很快采集COUNTER数字在一张巨大的spread sheet上。我们一直有一张流水一样的单子,把所有的电子资源都写上,包括永久购买的每年保存费,这是有一个管理员维护的,往往只在每年一段时间,看看我自己管的部分的CPU,然后在我决定续的资源上打上我名字缩写就可以了。

再好再有用的东西,一定要使用方便,否则没用。我是绝对不碰单反的,因为这对我来说就是个废物,因为我不可能拿这个东西出去玩的。
IP: 114.237.166.*   回复 | 赞 +1 [5]王启云   2023-12-2 20:41
胡大琴. 图书馆数字资源利用统计调查研究[J]. 图书馆建设, 2017, (12): 69-74.
摘要:国内外数字资源利用统计的标准及实践经验反映了我国图书馆数字资源利用统计存在未遵循统一标准、准确性难以判断、统计工作难以满足需求、应用领域广泛但分析方法相对简单等问题。基于这些问题,我国图书馆进行数字资源利用统计时应推动中文数据库商遵循COUNTER、提高数字资源利用统计工作效率、完善统计平台分析功能、规范统计指标。

胡大琴.面向数据库商的数字资源利用统计调查研究[J].图书馆杂志,2018,37(01):41-49+73.
通过问卷调查、访谈等方式调查了16家国内外知名的大中型数据库商,发现知名的外文数据库商基本遵循COUNTER,中文数据库商仅同方知网一家通过COUNTER审核,也仅4家遵循国内相关标准;中文数据库商仅同方知网能提供统计平台和日志信息;国内外数据库的统计功能均不够完善;各数据库商统计指标不一,同一指标定义不一;关于数字资源利用统计数据,数据库商应用广泛,且普遍认为对于图书馆和数据库商双方均非常重要。据此,探索数字资源利用统计的理想模式。
IP: 114.237.166.*   回复 | 赞 +1 [4]王启云   2023-12-2 20:03
韩新月. 图书馆数字资源统计行业标准的修订探讨与建议[J]. 图书馆, 2020, (11):1-5.
文章分析了图书馆统计与评估发展、《图书馆数字资源统计规范》应用实践以及标准化工作的发展现状,指出目前《规范》存在一定程度的滞后性和不适应性,建议从指标体系细化与延展、指标一致性调整、体现法律法规相关要求、标准规范衔接以及统计数据质量控制五个方面进行修订和更新,体现发展性、协同性和平衡性原则。

陶蕊,叶继元. 中美图书馆数字资源统计标准及指标比较研究[J]. 图书馆学研究,2021(16):35-43.
随着技术的进步,数字资源及相关服务已经成为图书馆重要的资源类型和服务内容。通过制定标准对图书馆数字资源的统计活动进行规范,有利于准确掌握图书馆数字资源及服务的现状,形成统计报告。通过文献调研法、网络调研法和比较分析法等对美国图书馆统计标准ANSI/NISO Z39.7:2013和中国图书馆统计国家标准GB/T13191-2009中的数字资源及服务的相关统计部分进行对比分析,了解中美两国标准统计指标的层次结构和内容特征。在此基础上,吸取美国先进经验,立足我国具体实践,为我国图书馆统计标准中数字资源相关的统计指标的未来发展提供参考。
IP: 114.237.166.*   回复 | 赞 +1 [3]王启云   2023-12-2 19:57
DRAA集团采购工作交流群中关于数字资源统计方法问答
东北师大姜老师问:counter下载量的统计从total_item_request 字段更改到 unique_item_request字段,是不是已经确定了?
CALIS李老师答:是的。DRAA集团评估采购unique指标。举例:用户登录数据库查找一篇文章,先是点在线阅读全文1次后,再下载PDF文件1次,再打印1次。
Total_Item_Requests指标是计 3次
Unique_Item_Requests 同个用户一次登陆,访问同一篇文章,去重后用量只计1次。
东北师大姜老师:今年年会说Unique_Item_Requests统计后,有好几个数据库下载量波动很大。那我们今年也用这个字段统计下载量。
CALIS李老师:主要看指标应用范围,从集团采购角度,有些库按照用量进行分级定价,那用total指标用量就不合适,因为指标变化造成的成本下降变成数据库涨价的理由也是不合理的。如果单馆评估使用情况,确实在线阅读、打印也是数据库的实际利用,total指标也有其存在合理性。各馆可以按需使用更适合指标,这有点像电子图书我们集团采购选TR_B1报告单本用量计算成本,很多图书馆使用TR_B3报告的章节用量计算利用情况。
杭州电子科大蹇老师:是这样的,不同的使用目的,取舍的数据就不同。 不过上报的统计数据就是糊涂账了。
IP: 114.237.166.*   回复 | 赞 +1 [2]王启云   2023-12-2 19:57
麦子:现在都用https://www.projectcounter.org/。如何计算使用是复杂的问题,因为要计算各种使用行为,我们一个管电子资源对此很清楚,而且专门做了一次培训,但还晕晕乎乎的。不过,群里好像从来也没有讨论过这个使用的计算问题,难道现在还是除了计算点击,就没有别的了?
IP: 49.88.61.*   回复 | 赞 +1 [1]王启云   2023-2-18 14:10
校图书馆再次重申:1.不得使用任何工具软件下载图书馆购买的电子资源;2.不得连续、系统、集中、批量下载文献,也不得将所获得的文献提供给校外人员,更不允许利用获得的文献资料进行非法牟利(由于各数据库商对'滥用'的界定并不一致,因此图书馆无法制订统一标准,一般数据库商认为,如果超出正常阅读速度下载文献就视为滥用);3.校内任何单位和个人,如设置相应的代理服务器,一定要事先得到图书馆允许,并且保证该服务器不得允许校园外IP通过它访问图书馆购买的电子资源;4.读者有义务妥善保管个人网络账号及电脑(服务器),如出现账号被盗、电脑受攻击等情况而造成了电子资源的违规使用,读者将承担相应责任;5.如发现违规行为,图书馆将协助学校有关部门进行追查。对违规者将视其情节轻重,予以相应的处罚,情节严重者,将报请学校予以纪律处分。由此而引起的法律上的一切后果由违规者自负。(摘自某高校通报.https://mp.weixin.qq.com/s/0NkXtj-J-I1hUg2hoQPD8w

1/1 | 总计:8 | 首页 | 上一页 | 下一页 | 末页 | 跳转

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-3-18 20:50

Powered by ScienceNet.cn

Copyright © 2007-2025 中国科学报社

返回顶部