科学网

 找回密码
  注册
Google告诉你词与物的历史Books Ngram Viewer
李斌 2011-5-13 01:50
Books Ngram Viewer 上线了,不仅有http://ngrams.googlelabs.com/可供在线检索,还有大量的data可供下载。 测试了几个词,真是很有趣,首先是“机器翻译”,1966年的alpac报告果然使得词频下降,很准。而后几经周折,起伏均合于历史。 然后是“语言学”,蛮好,现代语言学的发展可见一斑 然后是北京的翻译,英文翻译 ...
个人分类: Computational Linguistics|8343 次阅读|没有评论
CTB6.0的标注体系
热度 1 李斌 2011-5-6 14:28
被ctb的标记搞烦了,翻译抄录在此,备查 词类标记33个 AD 副词 AS 体标记 BA 把字句标记 CC coordination conj联合短语的标记“和、或” CD 数字 CS subordinating conjunction从属连词“如果,即使” DEC 关系从句中的“的” 一个星期的访问 修饰性 DEG associative 定语“的” 上海的工业设施 领属 ...
个人分类: Computational Linguistics|8929 次阅读|2 个评论 热度 1
CoNLL系列评测(笔记)
李斌 2011-4-2 00:08
CoNLL(Conference on Computational Natural Language Learning) 大会有论文集和评测 06年:13种语言的依存句法分析评测(有汉语) 07年:多语言依存分析(有汉语);英文依存分析的跨领域测试 http://cs.jhu.edu/EMNLP-CoNLL-2007/ 08年:英语 的依存句法-语义角色联合标注 09年:7种语言的依存句法-语 ...
个人分类: Computational Linguistics|6789 次阅读|没有评论
Mark Johnson的讨论班收获
李斌 2010-11-25 18:37
Mark Johnson今天下午在南大做了一个多小时的讨论。感觉比较有收获,他是做parsing的,主攻在parsing得到的几十棵候选结果中,筛选出最优的结果。收获总结如下: (1)他说,做研究有2种,一种是做state of the art,一种是做best in the future 5-10 years。这是对基础研究的肯定。 ...
个人分类: Computational Linguistics|3724 次阅读|没有评论
第五届全国青年计算语言学研讨会缺席之感
李斌 2010-10-22 20:30
全国青年计算语言学研讨会,原名全国学生计算语言学研讨会,宗旨是增进国内计算语言学的年轻力量,与会主力是研究生和本科生,会议免注册费和饮食费,程序委员会也是学生组成。我参加了2-4届,在会议上请教了专家,认识了朋友,增长了能力,现在工作了,看到同门带回的论文集,多少有点感触。 这届会议,一如 ...
个人分类: Computational Linguistics|5012 次阅读|3 个评论
反思计算语言学的政治取向
李斌 2010-10-10 19:43
做着做着,越发觉得计算语言学是一个高度政治性、军事性的学科,类似密码学、生化研究等战争必备的学科。 理据如下: (1)美国对阿拉伯语和汉语信息处理的投入越来越多,其目的非常明显,做情报收集。 (2)信息过滤、舆情监测,更是各国政府在网络时代必须的基本语言技术。 有此两点,顿感不应该研究汉语的计算问题,越研 ...
个人分类: Computational Linguistics|3579 次阅读|1 个评论

本页有 4 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-9 19:34

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部