||
对于不做技术的人,想了解chatgpt,可能有点麻烦。对于做技术的人,很容易一头扎进技术细节中,同样有点麻烦。为了更好了解Chatgpt,必须从最高层次来思维,建立知识体系。假如从最高层的思维方式作为入口点,还是比较简单的。
Chatgpt与过去的人工智能算法类似,存在类似的思维方式。
总得来说,Chatgpt要解决一个大问题,就是搞出“智能”。对于“智能”,我们更多只是想象,甚至定义都很困难,自然不存在明确的算法公式,不存在明确的数学公式。
研究人员想了很多的办法,其中之一就是模仿大脑的神经元,搞出了神经网络模型。因为人脑有大量神经元,研究人员自然认为模拟神经元的行为就可产生智能。研究人员先假设神经网络模型可行,能够解决问题,能够生成智能。
预先规定了神经网络模型,下一步为每个神经元规定参数。由于神经元数量庞大,参数数量同样庞大。
如何确定神经网络模型的参数?研究人员称之为“训练”。非常形象,类似训练狗狗,对了就给奖励;错了就小小惩罚。
原理就一个,平时也这么用。比如我们去爬山,看不到山顶道路,那就找一条向上的路先走着。我们去某地游玩,先找一条方向正确的路,等到靠近了游玩地方后再细细处理。在chatgpt上同样的方法。就是先设定一个值,用数值计算的办法,逐步靠近。自控系统理论也同样类似,先设一个初始值 ,然后根据实际情况逐步靠近。
神经网络模型的参数也是这样被确定。根据已存在的数据或者标准,计算出差距。根据差距调整神经网络模型的参数。对于任意一个参数a,如果参数增大一点,就可以使得模型更准,那就把a增大一些。如果变小一点,就可使得模型更准,那就减小一些。对所有的参数都进行类似调整。然后再做计算,根据计算结果进一步调整,直到满足要求。研究人员起了一个名字叫反向传播算法。
这种做法是人类最朴素的做法,但需要强大的算力,在实施过程中也有很多的技巧,需要大量的数据收集、梳理、分类处理等工作。了解以上的过程后,普通人也就明白为什么英伟达这么发财,也就明白为什么搞AI这么烧钱,也就明白为什么搞AI需要这么多数据。
在网络上大量文章介绍chatgpt,绝大多数在介绍chatgpt能干什么,怎么干的(即上文提到的模型具体样子,以及实现过程中的技巧)。chatgpt能干什么?总得来说,只要大家觉得他能干的,都可以试一下。
怎么干的?网上有很多的图片介绍Transformer模型。为什么要用Transformer模型?没有明确的理论和理由。只要不是专业人士,也就没必要深入了解。
以上说明一个事情。以后任何人都可以拿来一些数据,提供给模型。模型学会后照猫画虎,给出结果。
数理统计中回归同样如此。
对于非专业人士,人工智能模型特别友好。只要有数据,有标准,就可以训练出来,就可以帮人们做事。所以人们说会取代大量白领工作。
虽然非专业人士明白道理,但是具体工作还很多。未来也许有很多专做训练的公司,专做硬件模型的公司,还有专做外围设备的公司。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-10-11 10:39
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社