||
2018年6月26日,星期二,阵雨,微风。
1.印象最深刻的一个报告
按照日程安排,今天上午在伊利诺依大学香槟分校信息学院听报告,报告的题目是“Research and Practices of Digital Humanities and HathiTrust Digital Library”(数字人文和数字图书馆的研究与实践),报告人Professor Stephen Downie(伊利诺伊大学香槟分校信息学院托尼教授)
托尼教授是加拿大人,高中毕业后做过四年的出租车司机,因为兴趣爱好的原因后来念了音乐专业本科,再后来又读了计算机硕士,再再后来读了图情专业的博士,再再再后来就留校任教了。这个专业背景反差也太大了,托尼教授每介绍一句,大家就发出一连串惊讶的声音。不仅仅是专业经历传奇,托尼教授的讲课风格更是给足了大家惊喜,活泼有趣的语言,配上极为夸张的肢体动作,让学员们先前因担心语言不过关,以及对报告内容不熟悉而带来的担忧一扫而光,整个课堂轻松愉快,笑声掌声不断。
这个报告也是我第一次如此详细而又近距离的了解HathiTrust项目,项目之初,那些看似艰巨而又无法完成的事情,如今已惠及全球亿万学者,他们先进前沿的理念、奉献引领的精神、艰苦细致的付出,都给我留下了深刻的印象,也深深影响了我在从业过程中的思考与做法。在伊大校园两个周的时间里,每当我看到教学楼门口HathiTrust项目带有大象标记的LOGOL的时候,我都会拍一下照,以此表达心中对美国同行们的敬意吧。
2.HathiTrust概况
名字。Hathi来源于北印度语“大象”一词,这个名字背后的含义是“巨大的、强壮的”“永远不会忘记的”, 取此名意味着此项目将产生庞大的资源库,“大象”一词还意味着“明智、安全、值得信赖”。
概况。HathiTrust共享式数字仓储项目,始建于2008年,由美国中西部13所大学以及加州大学图书馆联盟共同协作创建,建立之初,是为了对所收藏的公共领域和馆藏文献资源提供长期保存和获取服务。之后随着联盟成员单位逐渐扩大到130多个,HathiTrust将自己的使命和宗旨重新定义为:通过合作收集、组织、保存、交流和分享人类知识记录,为学术研究、交流和人类公益事业做出贡献。项目将努力聚合全美顶尖级研究图书馆的资源和专家,继续寻求更多合作者加入。
截至2018年5月,该项目共收录了各类资源16000万件,在这些资源中,可向全球公众免费开放获取的约占资源总量的37%,另有大约63%的资源为受版权保护的资料,只能有限制的获取。HathiTrust整合的资源涵盖了所有学科,共有460多种语言文字,其中英文资源占50%左右,其它语言还有德、法、西班牙、俄、中文、日文、意大昨文、阿拉伯文等资源,HathiTrust努力实现对世界范围内数字资源的保存与长久服务。
数字化扫描。HathiTrust的资源来自于Google、InternetArchive(IA)和机构成员馆三部分。既包括原生数字资源,也包括数字化扫描文档。将印刷型文献进行数字化扫瞄是一项特别艰巨的任务。除了各成员馆数字化扫描的馆藏外,HathiTrust与Google进行了密切的合作。
数据存储。数据存储是HathiTrust最核心的工作之一,包括书目数据和全文数据。需要解决如何长期保存以及数据的传输转换。为此HathiTrust的书目数据采用自行开发的元数据格式。
版权问题。可以免费获取全文的包括1923年以前的出版物以及公共领域的出版物,对于那些受版权保护的出版物,只能有限制的获取。这部分资源对于非联盟馆成员虽然不能获取原文,但仍可以使用该项目的内容数据。
3.HathiTrus研究中心
HathiTrus研究中心成立于2011年7月,合作中心设在印第安纳大学和伊利诺伊大学香槟分校。它的使命是:努力联合全世界的研究人员完成万亿级文本数据挖掘和分析;开发网络基础设施,使HPC能够访问HathiTrust数字图书馆;开发用于处理、分析文本的尖端软件工具;开发翻译工具和数据,可用于提高HathiTrust数字图书馆服务的用户。
合作与共建共享是数字化时代图书馆发展的必然之路,HathiTrus项目做了一件了不起的事情,它的实现和发展,使资源的保存利用在时间和空间上都得到了极大的延伸,为人类科研和学术活动做出了突出贡献,传递了馆际平等、互利共赢、共建共享的理念。
(本文根据回忆写成,许多细节还需要再学习和了解;文中图表来源于托尼教授的报告,特此致谢!)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-25 01:32
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社