《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

按标题搜索
On Big Data NLP
热度 1 2013-7-27 20:43
Admittedly, it is not easy to develop an NLP ( Natural Language Processing ) system with both high precision and high recall (i.e. high F-score) due to the ambiguity and complexity of natural language phenomena. Social media is even more challenging, full of misspellings, irregularities, and ...
个人分类: 立委科普|5964 次阅读|2 个评论 热度 1
【科普随笔:NLP主流之偏见重复一万遍成为反真理】
2013-6-28 15:56
【科普随笔:NLP主流的傲慢与偏见】 中有些广为流传或广为采信的观点,岂止偏见,谬见是也,无需一驳,因为事实胜于雄辩 : 【偏见三】 规则系统的手工编制注定其不能 scale up,无法胜任 real world application,只能做实验室里的玩具。 谬!以我们在社交媒体大数据上运行的最新系统为例(当然这不是我的 ...
个人分类: 立委科普|5741 次阅读|没有评论
【科普随笔:NLP主流成见之二,所谓规则系统的移植性太差】
热度 3 2013-6-28 14:49
【科普随笔:NLP主流的傲慢与偏见】 中的第二条是 : 【成见二】 规则系统的手工编制导致其移植性差,转换领域必须重启炉灶,而机器学习因为算法和系统保持不变,转换领域只要改变训练数据即可(言下之意:移植性强)。 这一偏见的要害是先把语言学家当机器人(与傻子是同义词),假设手工编制的规则 ...
个人分类: 立委科普|8378 次阅读|6 个评论 热度 3
【科普随笔:NLP主流最大的偏见,规则系统的手工性】
热度 5 2013-6-22 21:11
【科普随笔:NLP主流的傲慢与偏见】 中的第一条是 : 【成见一】规则系统的手工编制(hand-crafted)是其知识瓶颈,而机器学习是自动训练的(言下之意:因此没有知识瓶颈)。 NLP(Natural Language Processing)主流对规则系统和语言学家大小偏见积久成堆,这一条可以算是万偏之源。随便翻开计 ...
个人分类: 立委科普|12400 次阅读|11 个评论 热度 5
乔氏 X 杠杠理论 以及各式树形图表达法
热度 4 2013-6-11 07:38
X-bar theory is not a good theory for NLP and phrase structure tree is not NLP-friendly. Dependency tree is much better but lacks node-level abstraction. Therefore the hybrid tree based on dependency structure but involving chunking level phrase structures is the better choice for parsing represen ...
个人分类: 立委科普|19631 次阅读|4 个评论 热度 4
【科普笔记:没有语言结构可以解析语义么?(之二)】
热度 1 2013-5-8 00:54
就这个问题,以前写过 【研发笔记:没有语言结构可以解析语义么?浅论 LSA】 ,介绍的是很流行的 LSA 统计算法,它利用自然语言篇章中的一袋子关键词(bag of words)之间的 lexical coherence,绕过语法结构分析,模拟语义,也显得很智能的样子 。 无独有偶,绕过语言结构解析语义在传统的知识系统中早有先 ...
个人分类: 立委科普|6141 次阅读|2 个评论 热度 1
【腾讯微信在移动社交媒体中的异军突起】
2013-4-15 18:09
Abstract: The Tencent WeChat app is revolutionary in social networking at the mobile platform. Not just Chinese counterparts of mobile Facebook, or Skype, or Facetime, or Voicemail, it is all of these but much more. Its explosive growth with hundred millions of users in such a sh ...
个人分类: 立委科普|5825 次阅读|没有评论

本页有 3 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-29 09:45

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部