博文

参见立委大人

已有 5052 次阅读 2016-11-26 11:22 |个人分类:Computational Linguistics|系统分类:人物纪事

听说咱们科学网NLP大牛李维老师开讲座，必须参拜一下。于是咱订了高铁，奔赴会场。李老师果然器宇不凡，讲起来激情四射，从身世讲到创业，讲到中文自动分析，头头是道。师从中国机器翻译的开创者刘涌泉刘卓老师，中关村创业，美国TREC第一届评测拿第一，获得2000万刀资金，这是个传奇。

一般来说，公司技术细节都不轻易外漏，在下突破行规，步步追问，方知李维老师基于规则的语言处理系统一隅。居然用的是Finite State Machine，不用recursive tree。一用就是几十层，每层几百条规则，这简直不可思议。李老师用了个很好的比喻。规则方法就好比厨子做菜。同样的材料和工序，菜的味道千差万别，源于厨子的技艺不同。世界上有很多不成功的规则系统，让人诟病。人们对规则方法嗤之以鼻，那是因为没见过成功的厉害的规则系统。这个系统就是李维老师的超大规则系统。凭着语言学的深厚功底，才能设计和驾驭如此庞杂的规则集合。

规则系统的好处是稳准狠，却难免召回率低。而在大数据前提下，召回率的问题可以大致忽略，准确性更为重要。所以这个系统用来做舆情分析有很好的效果也就顺理成章了。

厉害的是，李老师居然写了20多种语言的规则，真的让人不得不膜拜！规则方法写出的Parser和舆情系统，在这个世界上，恐怕也就仅此一家了。

最后，开心的得到合影一张：）

转载本文请联系原作者获取授权，同时请注明本文来自李斌科学网博客。
链接地址：https://blog.sciencenet.cn/blog-39714-1016878.html

上一篇：全国计算语言学学术会议CCL2016参会之感
下一篇：国内的国际化会议——第一次参加NLPCC有感

收藏 IP: 222.132.78.*| 热度|

随园厚学分享 http://blog.sciencenet.cn/u/gothere 计算语言学博士希望在这里留下学术的足迹

博文

参见立委大人

当前推荐数：9 推荐人：杨正瓴 武夷山 史晓雷 刘全慧 陈辉 操光辉 郑永军 章成志 bridgeneer

该博文允许注册用户评论请点击登录评论 (0 个评论)

李斌

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

随园厚学分享 http://blog.sciencenet.cn/u/gothere 计算语言学博士 希望在这里留下学术的足迹

博文

参见立委大人

当前推荐数：9 推荐人： 杨正瓴 武夷山 史晓雷 刘全慧 陈辉 操光辉 郑永军 章成志 bridgeneer

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

李斌

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

随园厚学分享 http://blog.sciencenet.cn/u/gothere 计算语言学博士希望在这里留下学术的足迹

当前推荐数：9 推荐人：杨正瓴武夷山史晓雷刘全慧陈辉操光辉郑永军章成志 bridgeneer

该博文允许注册用户评论请点击登录评论 (0 个评论)