随园厚学分享 http://blog.sciencenet.cn/u/gothere 计算语言学博士 希望在这里留下学术的足迹

博文

2017年年终小结

已有 5495 次阅读 2017-12-19 21:47 |个人分类:Computational Linguistics|系统分类:科研笔记

和往年一样,今年很累,累的觉得已经过40了。中文AMR、古汉语、认知属性三个领域齐头并进,对我这样的小硕导来说简直是自寻死路。在教学任务颇重的情况下,完成如下任务。

1.教学

春季完成3门课程:数据结构(下)、数据库应用、现代语言学方法研讨(研)的教学,每周共计10课时。

秋季完成4门课程:数据结构(上)、数理逻辑、人工智能、中文信息处理(研)的教学,每周共计11课时。

本科生大创国家级项目 史记·世家大事件平台开发,获得优秀结项。然后又滚动为下一届学生的大创项目。还带了一组大创做会话研究。

PS:上课真心很累,上半年连续上课一天,嗓子发炎导致上呼吸道感染,挂水修养一周。所幸学生们真的很棒,《史记》平台做的很认真也很漂亮,期待明年正式发布。


2.科研

专著1部,词语认知属性的知识库构建和应用(专著). 北京:世界图书出版公司·北京公司,2017年9月.

PS:此书写了五六年,花的功夫不亚于博士论文,但也灵气不如几年前了。从体系上与博士论文一脉相承,算是不错的姊妹篇,把语义计算的理论框架立起来,资源建起来了。书的包装印刷质量很满意。可惜相关论文的发表还不上档次,要争取多一些国际发表。刚刚又交了自己特别喜欢的一本小书给出版社,拖拖拉拉写了4年,封面设计颇费了一番功夫,希望明年初能够问世。


论文5篇:

李 斌, 闻媛,卜丽君,曲维光,薛念文. 英汉《小王子》AMR语义图结构的对比分析, 中文信息学报,2017(1). Bin Li, YuanWen, Lijun Bu, Weiguang Qu, Nianwen Xue. A Comparative Analysis of the AMR Graphs from English and Chinese corpus of the Little Prince. In Journal of Chinese Information Processing, China, 2017(1).(PDF)

李斌,闻媛,宋丽,卜丽君,曲维光,薛念文. 融合概念对齐信息的中文AMR语料库的构建, CCL2017(已录用). LI Bin, WEN Yuan, SONG Li, BU Lijun, QU Weiguang, XUE Nianwen. Construction of Chinese Abstract Meaning Representation Corpus with Concept-to-word Alignment. CCL2017(accepted).

李 斌, 陈静. 基于《日本语源大辞典》的汉源日词历时分析, 南京师范大学文学院学报, 2017年第3期. Li Bin, Chan Ching Lisa. The Diachronic Analysis of Loanwords from Chinese in Japanese based on Japan Etymology Dictionary. Journal of Chinese Language and Literature School at Nanjing Normal University. No.3, 2017.

王 晓玉,李斌. 基于CRFs和词典信息的中古汉语自动分词[J]. 数据分析与知识发现.2017, Vol.1 (5): 62-70.(PDF)

杨 倩,李雅欣,乔梁,陈蕊,杨珂,李斌. 《史记》人文检索平台开发及文本分析. 第十八届汉语词汇语义学国际研讨会,2017年5月18日至20日,四川,乐山.

PS:不知道今年在干啥,发了这些学校不计工分的论文,好像是只求发表,没有去冲击好的刊物。是啊,快速面世还是慢慢磨冲击一流,是个问题。主要还是写的水平不足,总要磨。。。实际上还有2篇英文会议的,因网上没正式挂出,暂不列了。


软著4项:

终于意识到把十年来做的软件申请软著,今年先申请4个比较急用的,明年再多申几个,最好能写一两个专利。

中文AMR人工标注平台,中古汉语语料库加工平台,人机交互式分词处理平台,汉语历时词库检索系统


语料发布:

终于意识到语料库的国际发布,不能烂在手里,于是把我们团队5年前就做好的《左传》分词标注语料发布到LDC了,希望对学界有些用处。发布地址:https://catalog.ldc.upenn.edu/LDC2017T14 。《左传》的人文数据则协议共享给哈佛大学CBDB,这也算是破天荒第一回了,挺开心。

与布兰迪斯导师联合研发的《小王子》AMR语料库已发布在我们自己的中文AMR平台,明年计划把1万句语料发布到LDC,供学界使用。


3.学术活动

在师兄带领下,承接CCL2016的会务工作,前后忙了一个多月。也不知道哪来的劲儿,貌似年龄到了,组织20多位学生好像也很自然。通过会议,锻炼了队伍,结实了学界的朋友,虽会务劳碌,也很满足。

今年怕手续烦,没敢出国,在国内参加了几个会议,收获都很大。与以前不同,今年开始掺和数字人文圈子的会议,遇到几位才俊,很是开心。做了多年的古汉语语料库和自动分析工作终于找了较为对口的会议和圈子。


4.明年计划与致谢

明年计划发表中文AMR和数字人文领域的论文为主,小书也即将问世。另外今年还签了一本经典的语言学教材的翻译工作,出版社开价六万,院系资助了五万,我还得拼着自己的经费去翻译,为的只是让今后的学生能更好地学会乔派的句法理论,明年交稿。资源方面,将中文AMR语料发布到LDC,希望《史记》和《诗经》数字人文平台明年能完成上线工作。明年至少还有6门课等着我。写到这,觉得我还有时间总结简直是奇迹,感谢老天还让我活着,感谢领导和师长的关怀,感谢我的家人的包容,特别感谢我的学生们大力支持,和我一起这么辛苦地追梦!




https://blog.sciencenet.cn/blog-39714-1090565.html

上一篇:学生的二叉树作业,用来分析细胞分裂次数
下一篇:《现代汉语动宾搭配的语义分析和计算》冯志伟先生2011年赐序
收藏 IP: 221.226.47.*| 热度|

3 武夷山 尤明庆 徐传胜

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 03:46

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部