全国青年计算语言学研讨会,原名“全国学生计算语言学研讨会”,宗旨是增进国内计算语言学的年轻力量,与会主力是研究生和本科生,会议免注册费和饮食费,程序委员会也是学生组成。我参加了2-4届,在会议上请教了专家,认识了朋友,增长了能力,现在工作了,看到同门带回的论文集,多少有点感触。
这届会议,一如既往地以学生为主体,论文集的特点也是以各种新的尝试为主。新的尝试,往往很难一下子做得很好,也很难发到高级别会议和刊物上,这个会议是一个不错的平台,用来交流想法和练手。看到计算《三重门》语言风格的论文、女真文输入法都显得很有意思。贾玉祥兄的名词性隐喻识别,很有语言学和计算融合的分量,怎么感觉都是佳作。
论文的几个大主题分别是:网络wiki挖掘,情感态度计算、隐喻计算、语义角色标注、翻译的句子预调序、少数民族语言字库输入法和词法分析。与过去很大的不同是,自动分词、词性标注的论文数量几乎掉到了最低谷。可见,分词标注问题大家已认为基本解决了。当然,过去几年,分词方面的基础研究我们南师大做的工作可谓不少,只是现在略有停顿,以后还会继续出新。感慨的是,少数民族语言处理,本来可以借鉴印欧语系、日语等处理的技术,无奈我们都没有充沛的精力去了解这些语言,只有期待未来的认知科学的大项目,一下子做掉国内的主要语言了。时代变了,大家都往语义方面研究了,不过,研究还是太偏模型的削足适履,对语言的考察偏少。听说山西大学做CFN遇到了不少难题,他们如果能把问题都公布出来,让学界一起了解和思考,也许是件大好事。
我总觉得,自己不应该再折腾编程了,好好地清清脑子,研究语言的可计算问题。如果可以建立好的语言模型,也省了理工科的学生们苦钻语言理论的痛苦,大家文理结合一下,呵呵。可是,不编是不行的,go on吧
https://blog.sciencenet.cn/blog-39714-376011.html
上一篇:
反思计算语言学的政治取向下一篇:
语义指向的英译应该修改为semantic depandency或constraint