|||
百度走向世界,需要闹出动静。成立深度学习研究院,从谷歌挖来 Andrew Ng 做掌门人,对于 marketing 有百益,无论能不能近期实用化。Andrew 做的 coursera 在教育界是革命性的,能不能在 NLP 做出同样革命性奇迹来,值得关注。百度大脑(Baidu Brain)项目从谷歌大脑(Google Brain)白捡了个相似的品牌来,标志以前饱受非议的人工智能(AI)已经正名,重新放出光彩来。
深度学习不懂,不好说,但能造成这么大的动静,相信确实有方法学上的突破。Intuitively,以前看机器学习领域的系统,发现他们确实很 robust,很 efficient,对于简单任务(文本分类,POS 之类)也有效,做起来很利索,但失之浅漏。一堆关键词也没有结构,主要就是根据 ngram 的记忆,从数据中找到蛛丝马迹的条件。现在有办法把传统的浅层的学习,推向多层学习,引起广泛兴趣是可以理解的。据说在图像识别语音识别方面,都已经在实用上大幅提高了系统质量。但是,在 text 方面,还没听说大的突破,可以拭目以待,乐见其成。
不管怎样学习,较复杂的NLP任务(句法分析,语义搜索,how、why的问答系统等)很难离开语言学结构和知识。简单任务可以离开结构,用ngram的冗余信息取代结构分析,用死记体现隐性的语言知识。对于复杂的任务,深度学习怎样利用和解构语言结构和知识呢?
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-21 22:07
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社