博文

ChatGPT时代呼唤新的语言学理论

已有 2760 次阅读 2023-1-24 11:36 |个人分类:Computational Linguistics|系统分类:观点评述

ChatGPT来了，性能很强大，用户非常多，争议非常大，对语言学、语言教学、写作、出版的冲击很大。

批评和反对的声音总结一下，有三种：

ChatGPT不知道自己在做什么，它只是一个超大规模语言数据上训练出来的模型，相当于一个记忆体，并没有多少学习与认知能力，更谈不上思考。严厉一点说，它就是台阅文无数的语言疯子。
ChatGPT严重干扰了学校的教学和论文写作等正常秩序。学生们可以使用GPT生成大量的文本，来完成作业、写论文、读书报告、程序代码，甚至可以完成毕业论文、文学作品等等。鼠标轻轻一点就完事儿了，这使得很多学生难以接受正常的知识技能训练，严重干扰了正常的教学秩序。
ChatGPT严重挑战了传统的语言学、心理学、文艺学等传统人文学科，也产生了许多知识产权、网络欺诈等相关的法律问题。因为ChatGPT基本没有用到传统的语言学、心理学的研究成果，而主要依赖大数据和神经网络模型。对语言学家来说，这是一个非常大的挑战。语言学有着辉煌的历史，对各种语言有大量的现象描写与规律总结，却没能开发出ChatGPT这样的产品。是理论出了问题，还是时代变了？

支持的声音也至少有两种：

ChatGPT有效推动了大数据和神经网络模型的发展，在资金、人才、技术、应用方面都吸引到了更多的资源。将来能够取得更大的技术进步与突破。ChatGPT在很大程度上，已经可以完成书面级别的图灵测试（机器可以像人一样，与人对话）。而图灵测试是1950年图灵的论文中提出来的，人们曾乐观地认为十年、二十年便可以实现，没想到拖到了今天。所以，ChatGPT还有很大的发展空间。
ChatGPT非常好用，应该好好利用。ChatGPT是一个非常方便的工具，用简单的命令，便可以生成符合要求的结果，虽然还不够完美，但是可以节约大量的时间与精力，是一个非常好的私人助手。

所以，一方面是技术公司不断涌入不断注资，一方面是用户不断增加，一方面是不断批评和反对。语言学家，应该怎么看？

要回答这个问题，还得回到乔姆斯基上世纪50年代发表的论文《描写语言的三种模型》。在这篇论文里，乔姆斯基就指出了马尔科夫模型的问题，认为马尔科夫这种模型，不足以生成合法的自然语言。作为基于语言数据的统计学习模型的先驱，马尔科夫模型在90年代之后就大放异彩，在计算语言学领域横扫了20年，之后逐渐被其他更好的统计学习模型取代。深度学习的诸多模型，也可以看做是这些统计模型的升级版。

GPT1-4代，不断刷新着语言学家的认知，为什么它越来越能生成合法的句子、甚至篇章？

作为大数据模型的对比，人类的小孩子一般3岁左右就可以学会说话。乔姆斯基就认为，小孩子并不需要成万亿规模的语言数据作为学习基础，较少的样本，便可以习得语言，所以区分出人类的先天语言习得装置（大脑硬件）和后天的语言习得过程。

现在看来，大数据输入+神经网络模型，可以是人脑之外的另一种语言习得与生成机制。就像人类发明的飞机，不一定需要两只会动的翅膀一样。

空气动力学、材料学、各种发动机开辟了航空航天的新世界。

人们不喜欢的化肥、饲料、育苗等农业技术促进了粮食产业。

主要的不同，是新技术没有脱胎于传统学科。ChatGPT的这种发展路线，是独立于语言学之外的一种技术路径。它本身除了数学基础和硬件技术之外，并没有针对语言、图像、音频的完善理论，就取得了非凡的进步。

所以，我们为什么不发展出基于这些技术实践的新理论、新方法呢？

转载本文请联系原作者获取授权，同时请注明本文来自李斌科学网博客。
链接地址：https://blog.sciencenet.cn/blog-39714-1373256.html

上一篇：一部优秀的NLP教材——《机器翻译》读后
下一篇：运用科技手段，提升汉语的世界科技文化承载力

收藏 IP: 180.110.59.*| 热度|

当前推荐数：2 推荐人：罗汉江 柏舟

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

李斌

扫一扫，分享此博文

随园厚学分享 http://blog.sciencenet.cn/u/gothere 计算语言学博士希望在这里留下学术的足迹

博文

ChatGPT时代呼唤新的语言学理论

当前推荐数：2 推荐人：罗汉江 柏舟

该博文允许注册用户评论请点击登录评论 (0 个评论)

李斌

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

随园厚学分享 http://blog.sciencenet.cn/u/gothere 计算语言学博士 希望在这里留下学术的足迹

博文

ChatGPT时代呼唤新的语言学理论

当前推荐数：2 推荐人： 罗汉江 柏舟

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

李斌

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

随园厚学分享 http://blog.sciencenet.cn/u/gothere 计算语言学博士希望在这里留下学术的足迹

当前推荐数：2 推荐人：罗汉江柏舟

该博文允许注册用户评论请点击登录评论 (0 个评论)