科学网

 找回密码
  注册
【李白对话录之11:parser 的三省吾身】
李维 2016-12-23 14:38
我: 白老师有关于深度分析的名言曰: parser三省吾身:有坑填乎?有盘翻乎?有subcat相谐乎? 填坑乃细线条句法,翻盘为语义重新计算,subcat 相谐引入本体常识。 宋老师提出的例子很有意思,属于语义翻盘: Jogger's nipple happens when a runner's shirt rubs against his exposed chest. google译为 慢 ...
个人分类: 立委科普|2996 次阅读|没有评论
【语义计算:从神经机器翻译谈起】
热度 6 李维 2016-12-17 06:07
我: 机器翻译所蕴含的厚重和神圣,在新一代是不可理解的 刚入行的时候做的是外汉机器翻译,一直不大敢碰汉外,原因是汉语语法不好形式 化,感觉太难了,当时想,这辈子怕都没指望了。 现如今,汉语语法还真没有见到多少大规模形式化能实用的,按照以前的路子,那汉外机器翻译必然寸步难行,因为汉语分析是前提,然后才是 ...
个人分类: 立委科普|6334 次阅读|7 个评论 热度 6
【语义计算:没有语言学的计算语言学,NLP的亚健康现状】
李维 2016-12-17 04:49
我: 大而言之,实词(对应概念)之间,只要发生句法关系,逻辑语义上就有个说法。 作为总原则去操作,句法标签总带着一个逻辑语义标签的做法,是有益无害的(最多是逻辑语义那边不增加新的信息,给个 dummy 的逻辑符号,assuming 句法标签对于语义落地足够了)。 但反过来,我们都知道,有不少逻辑语义是建立在没有句法直 ...
个人分类: 立委科普|4081 次阅读|没有评论
【一日一parsing:#自然语言太难了# 吗?】
热度 1 李维 2016-12-12 20:54
今天微博同仁圈子里盛传下面这个年末搞笑的帖子,标题是 #自然语言理解太难了# ,其实一点不难,可见即便是圈子内人,如果没深入做过parsing,有时也被表象迷惑。 #自然语言理解太难了# 转发段子:今年基本已经结束了,我刚在群里问了很多朋友今年挣钱了没?大多朋友都有挣,而且挣得五花八门:有挣个屁的,有挣个锤 ...
个人分类: 立委科普|3856 次阅读|1 个评论 热度 1
自然语言的并列: preference semantics at its worst
李维 2016-12-10 23:51
NLU、NLP 多年来还有一个公认的难点,就是并列结构(conjoined structure)。并列在思维逻辑里没有地位,它是语言表达的产物。并列是语言学中最不讲道理的程咬金,它总是横插一刀,而且任性,在任一层次。一切的 subcat arg structures 或 mod-head patterns 都必须为它让道,否则就堵塞交通,让 parsing 的路线断链。然而 ...
个人分类: 立委科普|3142 次阅读|没有评论
【立委科普:如何自动区分同一批词表达的不同意义?】
热度 1 李维 2016-12-10 08:43
这是上一篇自然语言理解(NLU)博客【 如何自动识别同一个意思千变万化的表达 】的姐妹篇。看上去似乎是同一个语言理解问题的两面,但实际上这个问题在自然语言领域的产生,很大程度上是因为一袋子词(bag of words)方法的流行引发的。此话怎讲? 本来,同一批词表达不同的意义是自然语言作为人类表达手段的题中应有之意 ...
个人分类: 立委科普|3131 次阅读|1 个评论 热度 1
【立委科普:如何自动识别同一个意思千变万化的表达?】
李维 2016-12-9 11:04
自然语言理解(NLU)的很多应用需要找到解答下列问题的算法:如何自动识别同一个意思千变万化的表达?譬如,问答系统或自然语言的任何人机接口,第一个问题就是如何理解不同用户千变万化的问题,以便从某个库里检索出合适的答案来。主流流行的做法仍然是绕过结构和理解,根据关键词、ngram以及 some word expansion,建立 ...
个人分类: 立委科普|3383 次阅读|没有评论
【语义计算沙龙:坐而论道 on 中文 parsing】
李维 2016-12-6 18:42
董: 刺死前妻男友男子获刑5年 死者系酒醉持刀上门 -- 百度新闻 Stabbed her boyfriend man jailed for 5 years, the drunken knife door --百度翻译 Stabbed his ex-boyfriend boyfriend was sentenced to death for 5 years the Department of drunken knife door -- 谷歌翻译 不知道这样结果是什么智能? -- 人工?鬼工 ...
个人分类: 立委科普|3494 次阅读|没有评论
【李白对话录之10:白老师的麻烦不是白老师的】
李维 2016-12-6 09:07
李: 突然想起一句话 怕忘了 写在这: 白老师的麻烦是 他懂的 我不懂 我懂的 他懂。 谁的麻烦? 乔姆斯基说 麻烦是白老师的 菲尔默说 麻烦是我的 后一种语义深度分析的结论是如何得出的? 语义要多茁壮 才能敌得过句法的标配啊。 而且这种语义的蛛丝马迹并非每个人都有捕捉的能力 它远远超出语言学 与一个 ...
个人分类: 立委科普|4049 次阅读|没有评论
【一日一parsing:他 / 喝了 / 三碗 / 汤】
李维 2016-11-15 10:55
bai: “他汤喝了三碗” 问题:“三碗”指向“汤”还是“喝”还是自己的省略被修饰语? 问题:它和“他喝了三碗汤”在语义上等价吗? 马: 强调的内容不一样吧,前者强调喝了三碗的是汤不是别的,后者强调是三碗 我: 要挖出变式的 nuances,不如把表层结构包括词序的差异保存 等到落地的时候 由应用的需要来决定这种 ...
个人分类: 立委科普|3265 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-9-25 01:04

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部