科学网

 找回密码
  注册
【博士涂鸦回顾:把常识代入文法的尝试】
李维 2016-9-16 10:10
上次说过,绝大多数的parsers对于谓词的 subcat 的表达都很简陋,伸展不开,多数不过把 subcat 当成一个代码,然后在相关的 subcat 规则中去确定 pattern。但是词驱动的文法 HPSG 却可以丝丝入扣,合情合理,可以直接在词典里面把 subcat 的 pattern 细致地描述,并对其句法语义的输入(pattern的条件)和输出(逻辑语义) ...
个人分类: 立委科普|3862 次阅读|没有评论
【中文处理小品:1234应犹在 只是56改】
李维 2016-9-4 10:01
成语的弹性识别和理解机制 白: “去年秋膘应犹在,只是猪颜改” 我: 1234应犹在 只是56改 成语弹性机制一抓一个准。一个成语中 哪些是变量 哪些是常量 可以研究。人心里大体有本帐。拿 “九牛二虎之力” 为例,弹性第一环是数词的变量化:m牛n虎之力 二牛九虎之力 九虎二牛之力 八虎七牛之力 四牛五虎之力 都不影响par ...
个人分类: 立委科普|3342 次阅读|没有评论
【一日一parsing, 而山不加增,何苦而不平?】
李维 2016-8-22 13:14
终于冰箱安装到位了, 欣喜之余发现有点儿小问题, 就联系了店家, 店家主动帮助联系客服上门查看, 虽然最终没有解决问题, 心里有点儿遗憾, 但是因为不影响使用, 所以也就无所谓了. 这一句够复杂的,目前这样子的: “店家” 与 “主动帮助”在主语之外,语义中间件给做了逻辑宾语,是 overkill,以为帮助 ...
个人分类: 立委科普|4450 次阅读|没有评论
【语义计算沙龙:从“十年中学文化课”切词谈系统设计 】
李维 2016-8-22 12:52
我: 毛老啊,1966-1976 10年文革,是我十年的中小学,我容易吗?10年中学文化课的时间不到一半,其余是学工学农学军。学赤脚医生 学开手扶拖拉机。 为什么是 【十年中】【学文化课】不是 【十年中学】【文化课】? Guo: @wei 单就这句,确实两可。但你后面有这么多的学…… 至少对这个例子,统计,深度神 ...
个人分类: 立委科普|2827 次阅读|没有评论
【一日一parsing:汉语单音节动词的语义分析很难缠】
李维 2016-8-22 05:27
白: “她拿来一根漂亮的海草,围在身上做装饰物。” 我: “围” 与 “做” 的逻辑主语阙如。原因之一是这两个动词本身的subcat没有要求“她”【human】或“海草”【physical object】。语义中间件目前是保守策略,因为逻辑填坑是无中生有,宁缺毋滥,rather underkill than overkill,精度优先。 人的理解是怎么回事 ...
个人分类: 立委科普|5639 次阅读|没有评论
【中文parsing:语义模块大有可为】
李维 2016-8-17 14:07
白: “放在行李架上的行李,请您确认已摆放稳妥。”----高铁的词儿。 我: 二者应该是等价的,现在接近了,还没等价。 想等价的话,条件已经具备:确认这样的词的前S(主语)与其后的OPred(动词性宾语),勾搭上,成为逻辑主谓,这是语义中间件很容易做的,因为条件清晰。 如果追求极致,那就动一下手术:(1)断掉 ...
个人分类: 立委科普|3660 次阅读|没有评论
Google SyntaxNet is NOT the “world’s most accurate parser"
热度 1 李维 2016-7-25 18:02
As we all know, natural language parsing is fairly complex but instrumental in Natural Language Understanding (NLU) and its applications . We also know that a breakthrough to 90%+ accuracy for parsing is close to human performance and is indeed an achievement to be proud of. Neverth ...
个人分类: 立委科普|6013 次阅读|1 个评论 热度 1
Is Google SyntaxNet Really the World’s Most Accurate Parser
李维 2016-7-23 22:40
No way! Google is a giant and its marketing is more than powerful. While the whole world was stunned at their exciting claim in Natural Language Parsing and Understanding , while we respect Google research and congratulate their breakthrough in statistical parsing space, we have to point ...
个人分类: 立委科普|4422 次阅读|没有评论
【deep parsing (120/n):李白侃中文parsing】
李维 2016-7-11 13:06
我: 陈: 日他,不是应该分析成 日 他 我: “日他”在我们sentiment中语义是落地了的,社交媒体中表达 negative 情绪的骂人的 白: 伟哥到隔壁做做两个句子 白: next有点耍赖 我: NEXT 不是有点耍赖 是非常耍赖。如今是把 NEXT 作为未来语义中间件的重点改造对象。 白: 人工智能那个,怎么排除另一个“发展 ...
个人分类: 立委科普|4130 次阅读|没有评论
【一日一parsing:”钱是没有问题”】
热度 1 李维 2016-7-11 05:45
雷: 2016年最佳语文组词能力: 钱是没有问题 ” 就这六个字的组词成句,可以变成不同意思的句子!哈哈,偉大的語文能力! 钱是没有问题 问题是没有钱 有钱是没问题 没有钱是问题 问题是钱没有 钱没有是问题 钱有没有問题 是有钱没问题 是没钱有问题 是钱没有问题 有问题是没钱 没问题是有钱 没钱是有问题 @wei parsing请 ...
个人分类: 旧文翻新|6237 次阅读|1 个评论 热度 1

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-1 20:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部