经济学雷锋分享 http://blog.sciencenet.cn/u/newniu

博文

从基础思维上理解Chatgpt的技术——文科生、普通人都能理解

已有 1563 次阅读 2023-6-2 09:11 |个人分类:科学人文|系统分类:人文社科

         对于不做技术的人,想了解chatgpt,可能有点麻烦。对于做技术的人,很容易一头扎进技术细节中,同样有点麻烦。为了更好了解Chatgpt,必须从最高层次来思维,建立知识体系。假如从最高层的思维方式作为入口点,还是比较简单的。

         Chatgpt与过去的人工智能算法类似,存在类似的思维方式。

         总得来说,Chatgpt要解决一个大问题,就是搞出“智能”。对于“智能”,我们更多只是想象,甚至定义都很困难,自然不存在明确的算法公式,不存在明确的数学公式。

         研究人员想了很多的办法,其中之一就是模仿大脑的神经元,搞出了神经网络模型。因为人脑有大量神经元,研究人员自然认为模拟神经元的行为就可产生智能。研究人员先假设神经网络模型可行,能够解决问题,能够生成智能。

        预先规定了神经网络模型,下一步为每个神经元规定参数。由于神经元数量庞大,参数数量同样庞大。

        如何确定神经网络模型的参数?研究人员称之为“训练”。非常形象,类似训练狗狗,对了就给奖励;错了就小小惩罚。

       原理就一个,平时也这么用。比如我们去爬山,看不到山顶道路,那就找一条向上的路先走着。我们去某地游玩,先找一条方向正确的路,等到靠近了游玩地方后再细细处理。在chatgpt上同样的方法。就是先设定一个值,用数值计算的办法,逐步靠近。自控系统理论也同样类似,先设一个初始值 ,然后根据实际情况逐步靠近。

     神经网络模型的参数也是这样被确定。根据已存在的数据或者标准,计算出差距。根据差距调整神经网络模型的参数。对于任意一个参数a,如果参数增大一点,就可以使得模型更准,那就把a增大一些。如果变小一点,就可使得模型更准,那就减小一些。对所有的参数都进行类似调整。然后再做计算,根据计算结果进一步调整,直到满足要求。研究人员起了一个名字叫反向传播算法。

     这种做法是人类最朴素的做法,但需要强大的算力,在实施过程中也有很多的技巧,需要大量的数据收集、梳理、分类处理等工作。了解以上的过程后,普通人也就明白为什么英伟达这么发财,也就明白为什么搞AI这么烧钱,也就明白为什么搞AI需要这么多数据。   

      在网络上大量文章介绍chatgpt,绝大多数在介绍chatgpt能干什么,怎么干的(即上文提到的模型具体样子,以及实现过程中的技巧)。chatgpt能干什么?总得来说,只要大家觉得他能干的,都可以试一下。

      怎么干的?网上有很多的图片介绍Transformer模型。为什么要用Transformer模型?没有明确的理论和理由。只要不是专业人士,也就没必要深入了解。

      以上说明一个事情。以后任何人都可以拿来一些数据,提供给模型。模型学会后照猫画虎,给出结果。

      数理统计中回归同样如此。

      对于非专业人士,人工智能模型特别友好。只要有数据,有标准,就可以训练出来,就可以帮人们做事。所以人们说会取代大量白领工作。

      虽然非专业人士明白道理,但是具体工作还很多。未来也许有很多专做训练的公司,专做硬件模型的公司,还有专做外围设备的公司。



https://blog.sciencenet.cn/blog-200346-1390254.html

上一篇:OPENAI中“涌现”的理解——更多领悟
下一篇:经济真相系列——用物理思维来理解经济
收藏 IP: 223.193.1.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-25 14:45

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部