数字人文,也称人文计算(Humanities Computing或Computing in the Humanities),它是一个将现代计算机和网络技术深入应用于传统的人文研究与教学的新型跨学科研究领域,它的产生与发展得益于数字技术的进步及其在科学领域的普及应用。上世纪60年代以来,在计算机媒介支撑下,人文知识的获取、分析、集成和展示都在发生重大变化。目前,已有海量的图书、报纸、期刊、照片、绘本、乐曲、视频等人文资料被数字化,并在Web上被提供给大众获取和使用。面对这种日益强化的数字化情景,人文学者急需相应的工具和平台对这些数字化人文资料进行组织、标引、检索和利用,以保证人文研究的持续性、一致性和高效性。数字人文研究的正是在这些数字媒介被应用于人文社科领域的过程,以及它们给人文科学和人文知识带来的变化和影响。
为了明确数字人文研究的路线和研究内容,国际文学与语言学计算联合会(Association for Literary and Linguistic Computing)主席Antonio Zampolli教授曾于2001年4月召集多个学科的研究者开展了一次综合性的人文计算研讨会,随后发布了Pisa报告。在此报告中,David Robey教授绘制并发表了一副有关“人文计算”的全景知识地图,如图1所示。
Digital Humanities作为一个学科名称和专业术语,是从Humanities Computing发展而来的。早期的人文计算发端于文学和语言学领域。从Roberto Busa对语言计算的初步探索算起,人文计算的发展已有近50年的历史。文学与语言学计算协会(The Association of Literary and Linguistic Computing)和《文学与语言学计算》(Literary and Linguistic Computing)期刊分别于1973年和1986年建立和首次发行。此后,人文计算研究的队伍日益壮大,研究对象的形式也从电子文本逐渐扩展到多媒体。
目前,无论是从研究项目的主题、学术机构的名称,还是已发表论文的题目来看,数字人文研究的学术共同体已经相当清晰[6],[7]。各种数字人文研究学会和专门的研究中心遍布全球,很多数字人文研究项目和研究成果也已经获得政府和学界的资助与关注。人文计算领域影响力最大的文学与语言学计算协会、人文领域计算机应用联合会(The Association for Computers in the Humanities)和数字人文学会(The Society for Digital Humanities / Société pour l'étude des médias interactifs)还联合组成了国际上最大的数字人文联盟组织——国际数字人文组织联盟(The Alliance of Digital Humanities Organizations)。目前,该联盟拥有四本同行评审期刊,向全球传播数字人文研究的理念、方法和成果。这四本期刊分别是牛津大学出版的《Literary and Linguistic Computing》期刊、加拿大麦克马斯特大学出版的《Text Technology》电子期刊、在线预出版物《Computers in the Humanities Working Papers》以及该联盟自身的专业电子刊物《Digital Humanities Quarterly》。该联盟每年召开一次数字人文年度大会,最近一次会议在美国马里兰大学召开,来自全球各国的近300名数字人文研究者集中展示了各自的研究成果和研究进展。
3 国际数字人文研究现状
3.1 整体情况
目前,全球范围内的数字人文研究中心不下20家,主要集中在欧美日等发达国家,其中较为知名的研究中心包括:伦敦国王学院的人文计算研究中心、美国斯坦福大学的计算机辅助人文研究中心和斯坦福人文实验室、麻省理工学院的Hyper studio、南加利福尼亚大学的数字人文研究中心、马里兰大学的人文技术研究机构、伊利诺伊大学的科学与学术情报研究中心、日本立命馆大学的京都数字文艺研究中心等。数字人文研究项目也已经在文学、历史学、艺术等多个领域得到展开,知名的项目包括:JSTOR Data For Research、Google Book Search、 Perseus Project、Crowds、The MONK project、Zotero、Text Analysis Portal for Research、ANDS、中国哲学书电子化计划等等。由于数字人文项目不仅涉及传统的人文领域,还涉及数字图书馆和数字博物馆建设,所以这些项目不仅受到像美国国家人文基金会(NEH)、日本科学技术振兴机构(JST)、德国研究基金会(DFG)、英国信息系统联合委员会(JISC)、加拿大人文社会科学联合会、澳大利亚联邦政府创新、产业、科学与研究部(DIISR)等国家级的科研基金会和科研管理机构的资助,还受到了包括梅隆基金会(Mellon Foundation)、麦克阿瑟基金会(MacArthur Foundation)、国际图书馆联合会(IFLA)、图书与信息资源委员会、美国博物馆和图书馆学会等众多公共基金会和专门的图书馆联盟和文化遗产保护机构的资助。
欧洲的数字人文研究起步较早。欧洲科学基金会人文常务委员会(ESF/SCH)对数字人文也给与了高度关注,并联合IEEE举办了多次e-humanities会议。欧盟数字图书馆也于2008年11月在布鲁塞尔正式启动,该图书馆门户网站包括各种书籍、音乐、绘画、照片和电影等各种信息和数字资料,该图书馆的启动为欧洲的数字人文研究提供了极大的便利。欧盟资助的专门的数字人文项目包括公共语言与技术基础平台项目(CLARIN)和DARIAN项目。在欧盟众多国家中,英国的数字人文研究走在了前列。英国信息系统联合委员会(JISC)已经资助了多个数字人文项目,例如人文万维网项目(World Wide Web of Humanities),其目标就是利用开源软件采集互联网档案为英国的数字人文研究建立一个框架和数据集合;TextVRE项目则是为数字人文研究中文本分析提供全生命周期的服务,以帮助人文学者处理和分析研究数据。在大学方面,英国的伦敦国王学院和曼彻斯特大学的数字人文研究在全球处于领先地位。此外,法国、德国、意大利、西班牙等国的人文学者也都已经开始了数字人文研究与实践。
为了提高电子文本的规范化和标准化程度,计算机与人文联合会(Association for Computers and the Humanities),计算语言学联合会(the Association for Computational Linguistics)与文学与语言学计算联合会于1987年成立了文本编码组(Text Encoding Initiative,TEI),并随后发布了多个文本编码标准。这些标准主要面向于人文社会科学研究,其目的是便于机器编码和识别,提高数字文本的传播、分析和教学效率。目前,TEI主要由英国牛津大学、美国布朗大学、美国维吉尼亚大学等机构资助,其标准已经得到数字人文学者广泛支持。这些标准的实施为人文社科领域的文本挖掘提供了极大的便利。
[4] McCarty, Willard. Humanities computing as interdiscipline. Is Humanities Computing an Academic Discipline? Paper delivered at IATH, University of Virginia. 5 November 1999.
[5] Wang Xiaoguang, Mitsuyuki Inaba. Co-word Analysis of Research Topics in Digital Humanities. In Proceedings of the International Conference of Digital Humanities 2009 (PP: 148-150), USA: 2009.6
[6] Warwick, Claire. No Such Thing as Humanities Computing? An analytical history of digital resource creation and computing in the humanities. Paper presented at ALLC/ACH 2004, Gothenburg. 2004
[7] Schreibman, S., R. Siemens, and J. Unsworth, eds. A Companion to Digital Humanities: Blackwell Publishing, 2004.