||
ChatGPT来了,性能很强大,用户非常多,争议非常大,对语言学、语言教学、写作、出版的冲击很大。
批评和反对的声音总结一下,有三种:
ChatGPT不知道自己在做什么,它只是一个超大规模语言数据上训练出来的模型,相当于一个记忆体,并没有多少学习与认知能力,更谈不上思考。严厉一点说,它就是台阅文无数的语言疯子。
ChatGPT严重干扰了学校的教学和论文写作等正常秩序。学生们可以使用GPT生成大量的文本,来完成作业、写论文、读书报告、程序代码,甚至可以完成毕业论文、文学作品等等。鼠标轻轻一点就完事儿了,这使得很多学生难以接受正常的知识技能训练,严重干扰了正常的教学秩序。
ChatGPT严重挑战了传统的语言学、心理学、文艺学等传统人文学科,也产生了许多知识产权、网络欺诈等相关的法律问题。因为ChatGPT基本没有用到传统的语言学、心理学的研究成果,而主要依赖大数据和神经网络模型。对语言学家来说,这是一个非常大的挑战。语言学有着辉煌的历史,对各种语言有大量的现象描写与规律总结,却没能开发出ChatGPT这样的产品。是理论出了问题,还是时代变了?
支持的声音也至少有两种:
ChatGPT有效推动了大数据和神经网络模型的发展,在资金、人才、技术、应用方面都吸引到了更多的资源。将来能够取得更大的技术进步与突破。ChatGPT在很大程度上,已经可以完成书面级别的图灵测试(机器可以像人一样,与人对话)。而图灵测试是1950年图灵的论文中提出来的,人们曾乐观地认为十年、二十年便可以实现,没想到拖到了今天。所以,ChatGPT还有很大的发展空间。
ChatGPT非常好用,应该好好利用。ChatGPT是一个非常方便的工具,用简单的命令,便可以生成符合要求的结果,虽然还不够完美,但是可以节约大量的时间与精力,是一个非常好的私人助手。
所以,一方面是技术公司不断涌入不断注资,一方面是用户不断增加,一方面是不断批评和反对。语言学家,应该怎么看?
要回答这个问题,还得回到乔姆斯基上世纪50年代发表的论文《描写语言的三种模型》。在这篇论文里,乔姆斯基就指出了马尔科夫模型的问题,认为马尔科夫这种模型,不足以生成合法的自然语言。作为基于语言数据的统计学习模型的先驱,马尔科夫模型在90年代之后就大放异彩,在计算语言学领域横扫了20年,之后逐渐被其他更好的统计学习模型取代。深度学习的诸多模型,也可以看做是这些统计模型的升级版。
GPT1-4代,不断刷新着语言学家的认知,为什么它越来越能生成合法的句子、甚至篇章?
作为大数据模型的对比,人类的小孩子一般3岁左右就可以学会说话。乔姆斯基就认为,小孩子并不需要成万亿规模的语言数据作为学习基础,较少的样本,便可以习得语言,所以区分出人类的先天语言习得装置(大脑硬件)和后天的语言习得过程。
现在看来,大数据输入+神经网络模型,可以是人脑之外的另一种语言习得与生成机制。就像人类发明的飞机,不一定需要两只会动的翅膀一样。
空气动力学、材料学、各种发动机开辟了航空航天的新世界。
人们不喜欢的化肥、饲料、育苗等农业技术促进了粮食产业。
主要的不同,是新技术没有脱胎于传统学科。ChatGPT的这种发展路线,是独立于语言学之外的一种技术路径。它本身除了数学基础和硬件技术之外,并没有针对语言、图像、音频的完善理论,就取得了非凡的进步。
所以,我们为什么不发展出基于这些技术实践的新理论、新方法呢?
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-10 20:11
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社