AI哲学_吴怀宇(中国科学院)分享 http://blog.sciencenet.cn/u/wuhuaiyu 博士教授。中科院博士、北京大学博士后、中国3D科技创新产业联盟副理事长、三体科技研究院院长,受聘多家机构的高端领军人才/导师//教授/研究员

博文

5.8.5、AI的五岳学派之四:统计学(频率学派)

已有 188 次阅读 2026-3-7 10:41 |系统分类:观点评述

opendai_logo.gif

频率学派是传统统计学的主流方法,其核心思想基于大数定律,认为概率是事件在长期重复试验中出现的频率。

频率学派认为模型参数是客观存在的,我们可以得到精准无误的参数值,且随着数据量的不断增加,可以不断地去逼近那个参数。

其缺点是模型假设过于严格、对异常值敏感、难以处理小样本与先验知识等。

点击+号关注本账号,可获得更多精彩内容。

频率学派(Frequentist Statistics)是传统统计学的主流方法,其核心思想基于大数定律,认为概率是事件在长期重复试验中出现的频率。该学派以概率的频率解释为核心,认为模型参数是客观存在的、是固定的未知量(未知的常量),可以通过大量观测数据去估计其真实值。频率学派强调通过统计模型对数据进行建模,通过假设检验和参数估计来推断模型的参数。频率学派的思想被广泛应用于分类、回归、聚类等任务中,通过构建统计模型(如线性回归、逻辑回归、支持向量机SVM、高斯混合模型等),利用最大似然估计、最小二乘法等统计方法,对数据进行拟合与预测,并使用假设检验和置信区间等工具来评估估计的可靠性。其广泛应用于A/B测试、流行病预测等领域,例如,社交平台利用频率学派分析用户行为分布以优化推荐策略。支持向量机(SVM)如下图所示,详细介绍参见章节“5.19.2  支持向量机SVM与逻辑回归LR”。

频率学派是数据驱动的机器学习方法,将模型参数θ看成“未知的常量”,通常用极大似然估计(MLE)的方法求解具体参数。

频率学派认为模型参数是客观存在的,它就在那里,如果存在一个上帝,我们就可以得到那个精准无误的参数值,且随着数据量的不断增加,我们可以不断地去逼近那个参数。

提示:“特征工程”依赖于统计模型和概率论原理来提取、识别、和描述图像的特征(如关键点、角点等),其主要源于统计学习学派,并在符号主义早期实践中有所体现。这些人工设计的特征描述子(比如SIFT、HOG)用于图像匹配、物体识别等任务,需结合分类器(如SVM)使用,属于“特征工程+浅层模型”的经典流程,代表了统计学习与手工特征设计的时代。然而,随着深度学习的兴起,深层神经网络能够在一定程度上自动提取特征,减少了对人工特征工程的依赖。因此,人工特征的重要性在端到端的学习中下降,但在数据稀缺或可解释性要求高的场景中仍不可替代。

频率学派的优势在于其数学理论严谨坚实、计算方法成熟,能够处理大规模数据集,并提供严格的统计推断和误差分析。然而,它也面临着模型假设过于严格(要求数据独立同分布)、对异常值敏感、难以处理小样本与先验知识等问题。由于其依赖于大样本假设,当数据量有限或样本分布不均匀时,可能无法提供可靠的估计结果。而且其概率解释基于“长期频率”,而非对单个事件的置信度,这使得它在某些场景(如医疗诊断)中显得不够灵活。在贝叶斯学派兴起后,研究人员逐渐转向结合两者的优势,形成混合统计模型。

更详细内容,请见本书的完整版。如果你有任何感想,请在评论区留言,一起讨论。

“AI哲学一吴怀宇”(中国科学院博士、北大博士后)作者主页:www.OpenDAI.org;邮件:huaiyuwu@sina.com

视频号/公众号:AI哲学一吴怀宇中国科学院(人工智能哲学)



https://blog.sciencenet.cn/blog-4099-1524802.html

上一篇:5.8.4、AI的五岳学派之三:行为(进化)学派
下一篇:5.8.6、AI的五岳学派之五:统计学(贝叶斯学派)
收藏 IP: 180.79.10.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-3-7 13:18

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部