博文

从基础思维上理解Chatgpt的技术——文科生、普通人都能理解

已有 1456 次阅读 2023-6-2 09:11 |个人分类:科学人文|系统分类:人文社科

对于不做技术的人，想了解chatgpt，可能有点麻烦。对于做技术的人，很容易一头扎进技术细节中，同样有点麻烦。为了更好了解Chatgpt，必须从最高层次来思维，建立知识体系。假如从最高层的思维方式作为入口点，还是比较简单的。

Chatgpt与过去的人工智能算法类似，存在类似的思维方式。

总得来说，Chatgpt要解决一个大问题，就是搞出“智能”。对于“智能”，我们更多只是想象，甚至定义都很困难，自然不存在明确的算法公式，不存在明确的数学公式。

研究人员想了很多的办法，其中之一就是模仿大脑的神经元，搞出了神经网络模型。因为人脑有大量神经元，研究人员自然认为模拟神经元的行为就可产生智能。研究人员先假设神经网络模型可行，能够解决问题，能够生成智能。

预先规定了神经网络模型，下一步为每个神经元规定参数。由于神经元数量庞大，参数数量同样庞大。

如何确定神经网络模型的参数？研究人员称之为“训练”。非常形象，类似训练狗狗，对了就给奖励；错了就小小惩罚。

原理就一个，平时也这么用。比如我们去爬山，看不到山顶道路，那就找一条向上的路先走着。我们去某地游玩，先找一条方向正确的路，等到靠近了游玩地方后再细细处理。在chatgpt上同样的方法。就是先设定一个值，用数值计算的办法，逐步靠近。自控系统理论也同样类似，先设一个初始值，然后根据实际情况逐步靠近。

神经网络模型的参数也是这样被确定。根据已存在的数据或者标准，计算出差距。根据差距调整神经网络模型的参数。对于任意一个参数a，如果参数增大一点，就可以使得模型更准，那就把a增大一些。如果变小一点，就可使得模型更准，那就减小一些。对所有的参数都进行类似调整。然后再做计算，根据计算结果进一步调整，直到满足要求。研究人员起了一个名字叫反向传播算法。

这种做法是人类最朴素的做法，但需要强大的算力，在实施过程中也有很多的技巧，需要大量的数据收集、梳理、分类处理等工作。了解以上的过程后，普通人也就明白为什么英伟达这么发财，也就明白为什么搞AI这么烧钱，也就明白为什么搞AI需要这么多数据。

在网络上大量文章介绍chatgpt，绝大多数在介绍chatgpt能干什么，怎么干的（即上文提到的模型具体样子，以及实现过程中的技巧）。chatgpt能干什么？总得来说，只要大家觉得他能干的，都可以试一下。

怎么干的？网上有很多的图片介绍Transformer模型。为什么要用Transformer模型？没有明确的理论和理由。只要不是专业人士，也就没必要深入了解。

以上说明一个事情。以后任何人都可以拿来一些数据，提供给模型。模型学会后照猫画虎，给出结果。

数理统计中回归同样如此。

对于非专业人士，人工智能模型特别友好。只要有数据，有标准，就可以训练出来，就可以帮人们做事。所以人们说会取代大量白领工作。

虽然非专业人士明白道理，但是具体工作还很多。未来也许有很多专做训练的公司，专做硬件模型的公司，还有专做外围设备的公司。

转载本文请联系原作者获取授权，同时请注明本文来自牛广锋科学网博客。
链接地址：https://blog.sciencenet.cn/blog-200346-1390254.html

上一篇：OPENAI中“涌现”的理解——更多领悟
下一篇：经济真相系列——用物理思维来理解经济

收藏 IP: 223.193.1.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

牛广锋

扫一扫，分享此博文

经济学雷锋分享 http://blog.sciencenet.cn/u/newniu

博文

从基础思维上理解Chatgpt的技术——文科生、普通人都能理解

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

牛广锋

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

经济学雷锋分享 http://blog.sciencenet.cn/u/newniu

博文

从基础思维上理解Chatgpt的技术——文科生、普通人都能理解

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

牛广锋

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)