||
2022年6月25日晚上8点至9点半,第一届古代汉语分词和词性标注国际评测子会议成功举行。该次评测会议是在法国马赛法罗宫举办的第十三届语言资源与评测国际会议(Language Resources and Evaluation Conference,LREC)的分会场,即第二届历史和古代语言技术研讨会(Workshop on Language Technologies for Historical and Ancient Languages,LT4HALA)上成功举办。
LT4HALA旨在汇集正在开发或正在使用语言技术处理历史语言的学者,以促进计算语言学界与处理历史语言数据的人文学科领域之间的相互交流,本年度的LT4HALA研讨会吸引了来自全世界的近百位学者参与,共有20篇口头报告、18篇会议报告,研究古拉丁文、古希腊文、古汉语、古代日语等古代语言的典籍进行自动分析。在闭幕式上,LT4HALA主席意大利圣心大学的Marco Passarotti教授特别提到了今年成功举办了古拉丁语EvaLatin和古汉语EvaHan两大评测,感谢Rachele Sprugnoli教授和李斌副教授做出的大量工作。
EvaHan的评测会议由南京师范大学文学院李斌副教授主持,特邀清华大学计算机科学与技术系教授、清华大学人工智能研究院常务副院长、欧洲科学院外籍院士孙茂松出席会议并为获奖团队颁奖。意大利帕尔玛大学(Università di Parma)Rachele Sprugnoli教授(LT4HALA主席),国家教育部语言文字应用研究所冯志伟研究员,清华大学黄昌宁教授出席此次会议。
EvaHan的古汉语评测竞赛由南京师范大学文学院计算语言学与数字人文研究组和南京农业大学联合组织,由北京大学数字人文研究中心、中国人工智能学会语言智能专委会、中国中文信息学会青年工作委员会、江苏省人工智能学会自然语言处理专委会、江苏省语言学会协助组织。
孙茂松教授在开幕词中指出,现代汉语的自动分词已经走过了约四十年的历程,各项标准制定和评测工作也开展得比较早,古汉语的分词和词性标注技术起步比较晚,也从未举办过评测工作,本次评测的成功举办大力推动了古汉语信息处理和古籍数字人文研究。
Rachele Sprugnoli教授表示,欢迎诸多的中国学者参加会议和评测。EvaHan给了我们一个机会,让我们即使身处千里之外,也能学习到新的知识,并对李斌副教授和主办单位师生付出的努力表示了感谢。
随后,李斌副教授报告了整个评测的过程和最终结果。汉语和英语不同,没有词语边界的标记,古汉语的词语边界识别是一项很难的任务,又是古籍深加工、走向概念知识库的基础性工作。第一届国际古代汉语分词和词性标注评测EvaHan是国内外首次举办的古代汉语分词和词性标注评测,于2021年12月20日正式启动并公布训练集,2022年3月31日公布测试集,4月7日参赛队提交待评测结果并由组织者完成评测。共有来自13个高校或公司的14支队伍参赛,提交了55份待评测结果。本次评测设置了两个测试集与两种评测模态,全面考察了各参赛队古汉语分词和词性标注系统的性能。数据均由南京师范大学计算语言学团队加工建设,以《左传》前十卷为训练集,后两卷为基测集,《史记》和《资治通鉴》中的部分语料选作盲测集。两种评测模态的不同在于是否限定参赛使用的预训练模型、训练集与外部特征。
二、比赛获奖情况
经过审核评比,最终,来自复旦大学的王鹏宇团队荣获一等奖,北京理工大学杨舒荀团队、北京邮电大学林博达团队荣获二等奖,广东外语外贸大学张海林团队、南京大学申雨瞳团队、南京师范大学中北学院蒋龙杰团队荣获三等奖。由孙茂松教授宣读获奖名单,并颁奖留念。
复旦大学王鹏宇团队提交的系统在本次评测中斩获多项最佳成绩,他们在《左传》测试集上得到的结果达到了目前古汉语词法分析的最高水平,分词和词性标注的F值分别达到96.03%和92.05%,其采用的局部语义增强策略与外部知识融合策略对古汉语文本信息处理有着启发性意义。他们通过计算语义相似度,获取与当前句子最相似的几部先秦古籍中的句子,将其作为辅助解决Monte-Carlo Dropout所得到的不确定样本的标注问题,较好地实现了语言知识与人工智能的融合。
冯志伟教授在总结致辞中指出,本次评测与EvaLatin(第二届古拉丁语自动分析评测)同时举办,两种古老的语言处理技术交相辉映,是古代语言信息处理的国际盛事。本次古汉语词法分析评测巧妙地设计了两种不同的测试集和评测模态,为古汉语词法分析构建了公开的标准数据集和评测方法,有助于后续研究的良性发展,充分肯定了本次评测的国际意义。
陈小荷教授在总结致辞中指出,“古汉语自动词法分析评测,这在国内外都是第一次。现代汉语的评测已经非常成熟,产生了一些标准数据集。但在古代汉语领域,研究者各用各的数据集,不利于资源和技术的交流。我们举办这次评测,希望能在古汉语标准数据集的建设上做出一点贡献。”并赞许了各参赛队许多令人耳目一新的设计。
他认为,资源和数据是词法分析的两大支撑。现代汉语与古代汉语有所不同,现代汉语词法分析的资源(包括词表、评测数据集等等)不能简单地移植于古代汉语词法分析。他还表示,训诂学家通过钻研古典文献及其注疏获得丰富的语言知识,因此,使用自然语言处理技术对古文献注疏中的词语知识进行自动挖掘,并作为一种资源用于开放测试,将有助于古汉语信息处理的发展和传统的古典文献研究。
李斌副教授致闭幕词,他表示,本次评测的成功举办,切实提高了古籍分词和词性标注的水平,增进了各研究单位及参赛队伍间的技术互享与了解。在今后还将举办古籍自动标点、命名实体识别、句法分析、语义解析和机器翻译等更多、更实用的评测竞赛。
最后,孙茂松教授宣布闭幕,会议在大家的合影留念中结束。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 07:34
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社