博文

《介绍监督学习的数学原理》短视频科普

已有 872 次阅读 2024-6-20 05:07 |个人分类:AI 浪潮|系统分类:科研笔记

9.46 a@A.Gv 09/17 mQK:/ 科普 # aigc https://v.douyin.com/ijouUSBq/ 复制此链接，打开Dou音搜索，直接观看视频！

我是AI大模型频道小雅，今天播报立委先生的短评《介绍监督学习的数学原理》。Open AI 前灵魂人物伊利亚曾经在伯克利给了一个 talk。这是注定载入史册的一次演讲，阐释非监督学习的GPT突破原理。这个演讲的开头部分讲的是监督学习（supervised learning）的数学原理。咱们今天先从这个比较容易的知识点开始讲起。说的是数据大模型大就是模型强的道理。暴力美学，美就美在，大即是美。插一句，这与唐代的审美观貌似相若：肥即是美？嘿嘿...说监督学习的数学保证，意思是，足够大的数据，足够多的参数，就会有足够高的精度。伊利亚为了怕“过拟合”（overfitting），特别强调了数据规模必须大于模型规模这个业内常识。“过拟合”的时候，训练误差虽然小，但测试误差降不下来。如果要让训练误差反映模型的实际能力（即测试误差），这是一个必要条件。否则，模型根本就不用做真正的抽象或“压缩”，不去找规律，它就全部死记硬背了。我们知道死记硬背的模型，缺乏泛化能力。它在训练集上可以考高分，但到了盲测的时候就抓瞎了，模型的质量得不到保证。所以给出的原理公式里面必然有模型大小这个变量，事实上这是一个决定性因素。数据量的增长会导致偏差指数级下降，保障模型质量的持续上升。伊利亚说监督学习没有问题，有理论上的保证。所谓理论就是那个统计学习的Hoeffding 不等式，说的是，随着训练样本数量增加，测试偏差超过一定阈值的概率会呈指数级下降。其主要含义是：当训练数据足够大，训练误差足够低，且训练数据远大于模型规模的时候，模型的泛化能力和精度是有保证的，这就是监督学习能够起作用的理论基础。这个其实我们早就知道了，第一，宏观上和理论上，“万能近似定理”（UUniversal Approaximation Theorem）早已论证了深层神经网络可以逼近任意函数。这其实是 scaling law 的源泉。第二，当代 AI 历史上，12年前的深度学习革命就开始证明，只要有足够带标数据，神经网络就可以让“老母鸡变鸭”，或做任何其他变换。但具体说来，为什么大模型一直强调“大”呢（模型大就是模型参数多），但现在似乎又在强调不能太大？那是因为数据超大的时候，模型不大，就消化不了。前大模型时代的传统机器学习就有这个问题。传统机器学习算法总体而论复杂度不够，模型过小，你给再多的数据也没用，它肚子小，吃不下，质量很容易达到一个点就基本 stuck there 了。深层的神经网络在原理上解决了这个问题，你总可以根据你的数据来决定需要多大多深的网络来适配才最佳。这是大模型之所以要大的一面。但也不能太大，要与数据规模拉开距离。换句话说，大数据必须大于大模型，这才是 scaling 的有效适配。ChatGPT 出来的时候，模型参数与模型数据是一个量级的，其实现在看来是某种过拟合了。GPT4 超过 ChatGPT3.5 的一个很大的原因，可能就是因为调整了这个比例。我是小雅，上面分享的是立委先生每次几分钟关于大模型的有角度的思考，希望对您有启发，咱们下次再见。

【相关】

转载本文请联系原作者获取授权，同时请注明本文来自李维科学网博客。
链接地址：https://blog.sciencenet.cn/blog-362400-1438911.html

上一篇：《谈谈端到端和大模型》短视频
下一篇：《谈两种复杂度》短视频科普

收藏 IP: 123.119.234.*| 热度|

当前推荐数：1 推荐人：郑永军

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

李维

扫一扫，分享此博文

《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵，插队修地球，1991年去国离乡，不知行止。

博文

《介绍监督学习的数学原理》短视频科普

当前推荐数：1 推荐人：郑永军

该博文允许注册用户评论请点击登录评论 (0 个评论)

李维

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵，插队修地球，1991年去国离乡，不知行止。

博文

《介绍监督学习的数学原理》短视频科普

当前推荐数：1 推荐人： 郑永军

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

李维

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

当前推荐数：1 推荐人：郑永军

该博文允许注册用户评论请点击登录评论 (0 个评论)