随园厚学分享 http://blog.sciencenet.cn/u/gothere 计算语言学博士 希望在这里留下学术的足迹

博文

语言信息处理的就业大潮来了!

已有 7176 次阅读 2017-5-6 18:10 |个人分类:Computational Linguistics|系统分类:观点评述


最近,我是说这一两年,像着了魔一样,大大小小的公司都找到我们这边要毕业生、实习生,谈合作。不得不说,语言信息处理的就业大潮来了!阿里、Nuance、腾讯、阿凡达等十几家公司都在招语言标注师、语言数据分析师,主要从事语言资源的标注、校对、数据分析工作,对于语言学和编程能力都有一定要求。这种工作,纯语言学的学生做不了,程序员也做不了。做语言资源的工作,需要有良好的语言学基础知识,比如语音、文字、词汇、语法、语义、语用,这样才能应对各种语言现象。而编程能力不必像程序员那么专业,掌握PYTHON、MySQL之类的基本操作能力即可,能够把语料库建起来,知道怎么标注才好被计算机处理。

说到这,不得不佩服我们的系主任早在十几年前就开辟了这样一个“语言科技系”,形成本硕博培养梯队,培养语言信息处理的文理复合型人才。到现在为止,已经培养了十多届学生。然而可惜的是,只有少部分学生从事了这个行业,毕竟这行在国内也就这两年进入了井喷期。以前,跟学生说,这个行当未来很好,你们好好学编程,将来肯定不错。他们大都不信,也不想下功夫学。这两年呢,情况变了,就业形势好起来了,有的学生甚至埋怨我没逼着让他学好编程。现在,我要对学生们负责任地说,不是将来,就是现在,只有你语言学学的不错,掌握了基本的编程能力,参与标注过语言资源,那么你的就业不成问题,甚至任你挑。

当然,这两年,随着深度学习的火热,人工智能和自然语言处理(NLP)在计算机系狂招学生,薪水也是水涨船高,动辄20万起薪,吸引了大批的程序员。而人工智能的软件系统目前仍建立在学习样本之上,语言智能方面的研究自然离不开人工标注的大量语言资源作为学习样本。通俗地讲,AlphaGo可以从围棋的棋局中学得下棋的本领,但围棋规则少,哪里有语言复杂。让机器处理语言,直接学人们的对话是很困难的,必须有人工标注的适合机器学习的语言资源才行。语言资源的量还特别巨大,因为全世界至少有几千种语言,方言就更多啦,文本上看呢也几百种文字要处理。互联网上文本已多如牛毛,单以搜索引擎的处理需求来说就很大了。何况还有机器翻译、人机对话、舆情分析等巨大的产业需求。

单说南京,这几年建立的NLP方面的公司就多达十几家,全国来看,体量不少于几百家。现在还是产业初创期,很多资源、软件的整合度不足,将来肯定是大鱼吃小鱼,公司的体量会不断增加,产业规模越来越大,我们的生活也越来越智能化。

所以,同学们,加油吧!




https://blog.sciencenet.cn/blog-39714-1053329.html

上一篇:没想到是一部文理交融之作——维纳的《控制论》
下一篇:民科的出路——做俗家弟子
收藏 IP: 223.65.13.*| 热度|

7 周健 徐勇刚 蔡宁 赵庆华 icgwang xlsd financialpaper

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 04:38

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部