科学网

 找回密码
  注册
【李白之15:白老师的秘密武器探幽】
李维 2017-1-3 20:31
【立委按】 白老师不动声色开始亮剑了:独创的自然语言的parsing法术,无需规则,无需带标数据,词典主义标注加无监督大数据以克服知识瓶颈。深度计算,句法语义交融,借力RNN,以平天下。小试牛刀,以中文难句为例。先睹为快,以飨同仁。 我: 省略 head 最可恨。从“的字结构”和what-clause始,恨的是 队员 ...
个人分类: 立委科普|4137 次阅读|没有评论
【李白之14:深度分析牛就牛在一个深字!】
李维 2017-1-3 07:15
白: “认错的人我原谅了”“认错的人原谅我了” “这场雨来的不是时候”“这场雨来得不是时候”哪个对? “这场雨来的不是时候”、“这场雨来得不是时候”,感觉前者说“来”不是时候,后者说“雨”不是时候。个人倾向前者。 我: 谁原谅谁,句式蛮普通的。这里面还有其他的 catch 吗? 白: 两个不同的“认错”:一 ...
个人分类: 立委科普|3749 次阅读|没有评论
【语义计算:李白对话录系列】
李维 2017-1-3 07:13
【立委按】 世有李白者,精于语义,勤于计算,一敏一木, 一弦一弹 , 无论魏晋 ,不知有汉。每日坐而论道,波澜不惊,各得其乐,天马空行。挥斥方遒,指点语言,和寡曲高,流水云天。有道是,一擎核弹一拨弦,不是冤家不上船。 【李白之35:句法分析 bottom up 为基础,可穿插 top down】 ...
个人分类: 立委科普|3374 次阅读|没有评论
【李白之12:修正乔老爷的保守派自由派之辨】
李维 2016-12-29 19:24
白: “他们把总裁开掉的人训了一顿。”“他们把总裁开掉的人吃了一顿。” 我: 总裁开掉的那些人吃了一顿。 把总裁开掉的那些人吃了一顿。 “他们把总裁开掉的人吃了一顿。”属于合法非法边缘,语感上别扭:“他们”与“人”coreference,很多人不接受。 白: 同位语 我: 觉得别扭。 这些句子真心难。 试一试 parser。 ...
个人分类: 立委科普|4150 次阅读|没有评论
【李白对话录之11:parser 的三省吾身】
李维 2016-12-23 14:38
我: 白老师有关于深度分析的名言曰: parser三省吾身:有坑填乎?有盘翻乎?有subcat相谐乎? 填坑乃细线条句法,翻盘为语义重新计算,subcat 相谐引入本体常识。 宋老师提出的例子很有意思,属于语义翻盘: Jogger's nipple happens when a runner's shirt rubs against his exposed chest. google译为 慢 ...
个人分类: 立委科普|2821 次阅读|没有评论
【语义计算:从神经机器翻译谈起】
热度 6 李维 2016-12-17 06:07
我: 机器翻译所蕴含的厚重和神圣,在新一代是不可理解的 刚入行的时候做的是外汉机器翻译,一直不大敢碰汉外,原因是汉语语法不好形式 化,感觉太难了,当时想,这辈子怕都没指望了。 现如今,汉语语法还真没有见到多少大规模形式化能实用的,按照以前的路子,那汉外机器翻译必然寸步难行,因为汉语分析是前提,然后才是 ...
个人分类: 立委科普|6113 次阅读|7 个评论 热度 6
【语义计算:没有语言学的计算语言学,NLP的亚健康现状】
李维 2016-12-17 04:49
我: 大而言之,实词(对应概念)之间,只要发生句法关系,逻辑语义上就有个说法。 作为总原则去操作,句法标签总带着一个逻辑语义标签的做法,是有益无害的(最多是逻辑语义那边不增加新的信息,给个 dummy 的逻辑符号,assuming 句法标签对于语义落地足够了)。 但反过来,我们都知道,有不少逻辑语义是建立在没有句法直 ...
个人分类: 立委科普|3885 次阅读|没有评论
【一日一parsing:#自然语言太难了# 吗?】
热度 1 李维 2016-12-12 20:54
今天微博同仁圈子里盛传下面这个年末搞笑的帖子,标题是 #自然语言理解太难了# ,其实一点不难,可见即便是圈子内人,如果没深入做过parsing,有时也被表象迷惑。 #自然语言理解太难了# 转发段子:今年基本已经结束了,我刚在群里问了很多朋友今年挣钱了没?大多朋友都有挣,而且挣得五花八门:有挣个屁的,有挣个锤 ...
个人分类: 立委科普|3681 次阅读|1 个评论 热度 1
自然语言的并列: preference semantics at its worst
李维 2016-12-10 23:51
NLU、NLP 多年来还有一个公认的难点,就是并列结构(conjoined structure)。并列在思维逻辑里没有地位,它是语言表达的产物。并列是语言学中最不讲道理的程咬金,它总是横插一刀,而且任性,在任一层次。一切的 subcat arg structures 或 mod-head patterns 都必须为它让道,否则就堵塞交通,让 parsing 的路线断链。然而 ...
个人分类: 立委科普|2942 次阅读|没有评论

本页有 1 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 02:55

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部