科学网

 找回密码
  注册
【河东河西,谁敢说SMT最终一定打得过规则MT?】
李维 2016-6-18 22:49
Xi: @wei , 评论一下李明教授的机器翻译。我纳闷这年头这么多人跨界来和你抢食啊? 我: 评论啥,我对MT无感了,都。 我现在是,胸怀知识图谱,放眼世界大同。早翻过MT那一页了。 不过话说回来,学自然语言的人如果入行做的就是规则机器翻译,那是上天的赐福。新一辈这种人没有了,所以很多入行多年的人,看到的语 ...
个人分类: 立委科普|4235 次阅读|没有评论
【科普小品:NLP 的锤子和斧头】
李维 2016-6-7 00:41
与老友又谈到了deep 还是 shallow NLP 的事儿。 老友说,你必须承认,工业界的 NLP 绝大多数成规模的应用都是 shallow NLP 在支撑的,背后的基础技术是学习(ML),如今是深度学习(DL) (规则派NLP一直也在不同的 产品中有见 ,但规模和影响力无法与学习比 ) 。 我说,我又不是瞎子,怎能不知道。 没用 deep ...
个人分类: 立委科普|4440 次阅读|没有评论
【泥沙龙笔记:语义可以绕过句法吗】
李维 2016-6-3 08:01
雷晓军: 可以直接语意吗?绕过句法。 我: 直接语义绕过句法是绝对错误的 雷: 愿闻其详 我: 这个以前谈过多次,也有历史案例(Wilks),董老师也一再教导,那是死路。但是对于pure research,是个可以探索的方向。 这里有其详:《 泥沙龙李白对话录:关于纯语义系统 》; 【 没有语言结构可以解析语义么?(之二 ...
个人分类: 立委科普|3501 次阅读|没有评论
【deep parsing 小品:谁的牛皮大,大家六一快乐】
李维 2016-6-1 00:00
白: 【小新日记】 今日李叔叔来我家玩妈妈,说我做完作业后,可以吃点心。然后,李叔叔夸我作业做的好,于是抱起了我妈,妈叫叔叔小心一点,之后叔叔又亲了我妈妈,也亲了我。 老师批复:拿回家让你爸看看,是标点符号有问题还是你李叔叔和你妈妈有问题! 大家六一快乐 我: 看看我的parser怎么认为的 ...
个人分类: 立委科普|3857 次阅读|没有评论
【新智元笔记:工程语法与深度神经】
热度 2 李维 2016-5-29 13:45
我: 汉语的类后缀(quasi-suffix)有不同的造词程度,“-者” 比“-家”强。“ 者” 是 bound morpheme,“家(home)” 通常是 free morpheme,突然来个“冷笑家”,打了个措手不及 @白老师。 不敢轻易给这种常用的 free morpheme 增加做类后缀的可能性,怕弄巧成拙。即便是人,乍一听这句子中的“冷笑家”也有点怪 ...
个人分类: 立委科普|5434 次阅读|2 个评论 热度 2
【deep parsing:“对医闹和对大夫使用暴力者,应该依法严惩"】
热度 1 李维 2016-5-10 00:38
我: 这个细究的话,还有不少工作 但现在的样子,总体上是对了: 1. 句法形式上,可以说,“对。。。” 是状语 Adv 2. 深层句法上,“对。。。” 是“依法严惩”的predicate complement,接近宾语了,因为不是“把”引导,而是“对”引导,因此就叫它补足语,总之是 internal arg,逻辑语义表示【对象】(而不是【 ...
个人分类: 立委科普|4066 次阅读|1 个评论 热度 1
哪些概念皮之不存,像一个飘荡的幽灵?
李维 2016-4-29 09:03
哪些概念物化为语词,哪些概念永远皮之不存,像一个飘荡的幽灵? (《知网》读书笔记) 我 : 语义深似海,常识底为最。知网小世界,董老大智慧。 知识就是一个灰色的箱子,在模型化的过程是黑化还是白化的选择。合成词里面有很多灰色的东西,看上去半透明。完全透明了,就没有进入词典的理由 ...
个人分类: 旧文翻新|3249 次阅读|没有评论
【泥沙龙笔记:NLP 专门语言是规则系统的斧头】
李维 2016-4-19 01:00
我:接着上篇的“毛毛虫”话题往下说专用语言。 NLP 专用语言 (属于 domain language 范畴吧) 涉及 formalism (FSA++) 的定义 (包括 syntax sugar)以及实现(language parsing, compiling and running), 这是极为重要的毛毛虫基础工作 。 否则的话,往往只能做玩具系统,譬如我硕士阶段拿通用语言 BASIC 做 ...
个人分类: 立委科普|3659 次阅读|没有评论
【立委科普:结构歧义的休眠唤醒演义】
热度 1 李维 2016-4-17 04:58
以前论过, 休眠唤醒是一个很重要的机制,它是应对结构歧义的通用手段 。人会装死装睡当然唤不醒,语言虽然也是人说的,但一言既出驷马难追,说出口的句子就是无生命的客观存在,是有限词汇有限排列的线性信息流,没法装了,理论上没有唤不醒的隐藏路径。 譬如:“ 蒙牛关注并激励大学生的梦想 ” Our determiniti ...
个人分类: 立委科普|6218 次阅读|1 个评论 热度 1
【泥沙龙笔记:依存语言学的怪圈】
李维 2016-4-15 13:32
今天在思考死循环的问题。这是一个逻辑问题,也涉及语言学怪圈 , trigger 是所谓的父子原则:【 科普小品:文法里的父子原则 】 。 子曰,君君臣臣,父父子子。纲常不可乱。 当然乱的也有,下面的故事便是。 Nick: @wei 我现在要上班,等周末空下来和你掐这个。 我先扯着,等@N ...
个人分类: 立委科普|4482 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 06:04

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部