《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

按标题搜索
NLP 围脖:成语从来不是问题
热度 1 2011-12-31 22:06
成语的本质是记忆,凡记忆电脑是大拿,人脑是豆腐。 作者: 立委 日期: 12/31/2011 08:04:01 当然要大词库,无论何种方式 建立,只要想做就可以做,因此不是问题。 所谓自然语言“理解”,就是把 open expressions 分解成词典单位(包括成语)的关系组合(术语叫 semantic compositionality)。凡事到了词典层 ...
个人分类: 立委科普|6422 次阅读|2 个评论 热度 1
后生可畏,专业新人对《迷思》争论表面和稀泥,其实门儿清
2011-12-31 05:19
“专业新人” (early stage researcher)也别被我的夸赞冲昏头脑。门道门道,有门有道。门儿清,不等于道儿清。做到门儿情,只要聪颖和悟性即可,而道儿清要的却是耐性、经验、时间,屡战屡败、屡败屡战的磨练,而且还要有运气。是为冰冻之寒也。 On Thu, Dec 29, 2011 G wrote: As you titled your ...
个人分类: 立委科普|4291 次阅读|没有评论
专业老友痛批立委《迷思》系列搅乱NLP秩序,立委固执己见
2011-12-29 23:29
G 是资深同行专业老友很多年了,常与立委有专业内外的交流。都是过来人,激烈交锋、碰撞出火是常有的事儿。 昨天给他邮去《迷思》系列三则,他即打电话说:“好家伙,你这是惟恐天下不乱啊。看了《迷思》,我就气不打一处来。你这是对中文NLP全盘否定啊,危言耸听,狂放颠覆性言论。偏激,严重偏激,而且误导。虽然我 ...
个人分类: 立委科普|5964 次阅读|没有评论
中文处理的迷思之二:词类标注模块是句法分析的前提
热度 1 2011-12-28 16:59
词类标注(Part-of-speech Tagging: POS)是汉语句法分析的前提么? 没有这回事。 如果说为了模块化开发的方便,中文处理系统先行词类标注,再行句法分析,这种类似于多数英语分析器的架构从工程上看确实有一定的道理,但是词类标注并非句法分析的前提。 点破这一迷思的最直接的例证就是完全可以设计一 ...
个人分类: 立委科普|6748 次阅读|1 个评论 热度 1
中文处理的迷思之一:切词特有论
热度 7 2011-12-28 13:33
电脑的中文处理业界有很多广为流传似是而非的迷思。在今后的随笔系列中,准备提出来分别讨论。 迷思之一:切词(又叫分词,word segmentation)是中文(或东方语言)处理特有的前提,因为中文书写不分词。 切词作为中文处理的一个先行环节,是为了模块化开发的方便,这一点不错。但它根本就不特有。 任何自 ...
个人分类: 立委科普|13852 次阅读|11 个评论 热度 7
突然有一种紧迫感:再不上中文NLP,可能就错过时代机遇了
热度 1 2011-12-10 20:29
与业內老友的对话:在‘用’字上狠下功夫 耳边响起了林副主席关于系统开发的谆谆教导: Quote 带着问题做,活做活用,做用结合,急用先做,立竿见影,在‘用’字上狠下功夫。 from: http://blog.sciencenet.cn/home.php?mod=spaceuid=362400do=blogid=510567 这是从与朋友的内部 ...
个人分类: 立委科普|6480 次阅读|2 个评论 热度 1
坚持四项基本原则,开发鲁棒性NLP系统
热度 3 2011-12-9 07:04
《科研随笔:自然语言处理系统的鲁棒性》 以前说过,一个 real life 自然语言处理系统,其质量和可用度除了传统的 data quality 的衡量指标查准度(precision)和查全度(recall)外,还有更为重要的三大指标:海量处理能力(scalability), 深度(depth)和鲁棒性(robustness)(参见:《 “三好”立委要做“三有” ...
个人分类: 立委科普|9460 次阅读|5 个评论 热度 3
应该立法禁止切词研究 :=)
热度 1 2011-12-6 05:56
RE: 切 词当然是第一关。这个没弄好,其他的免谈 现如今中文自动分析的瓶颈早已不是切词了 日期: 12/05/2011 15:43:43 半个世纪折腾进去无数的人力了。是 overdone,很大程度上是科研财主(sponsors)和科学家共同的失察。应该立法禁止切词(word segmentation or tokenization)研究(kidding :=)),至少是禁 ...
个人分类: 立委科普|10022 次阅读|2 个评论 热度 1
再说苹果爱疯的贴身小蜜 死日(Siri)
热度 1 2011-12-6 04:55
话说这苹果真是能折腾,一个技术课题硬是折腾成大众话题,弄得满世界都在谈论苹果爱疯的贴身小蜜 “死日”(Siri,没追踪来源,但瞧这名字起的),说是她无所不能,能听得懂主人的心思,自动打理各项事务,从天气预报,到提供股票信息,甚至做笔记。不服不行,人家就是把这个科幻世界的机器人功能产品化了,挑起了大众的 ...
个人分类: 立委科普|6376 次阅读|1 个评论 热度 1

本页有 1 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-26 23:45

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部