flyada的个人博客分享 http://blog.sciencenet.cn/u/flyada

博文

K-fold cross-validation— K折(层)交叉检验

已有 7701 次阅读 2012-3-23 09:23 |个人分类:授业解惑|系统分类:科研笔记| style, 数据, 检验, training

K折交叉检验是指,在机器学习中,将数据集A分为训练集(training set)B和测试集(test set)C,在样本量不充足的情况下,为了充分利用数据集对算法效果进行测试,将数据集A随机分为k个包,每次将其中一个包作为测试集,剩下k-1个包作为训练集进行训练。
 

K层交叉检验,就是把原始的数据随机分成K个部分。在这K个部分中,选择一个作为测试数据,剩下的K-1个作为训练数据。

交叉检验的过程实际上是把实验重复做K次,每次实验都从K个部分中选择一个不同的部分作为测试数据(保证K个部分的数据都分别做过测试数据),剩下的K-1个当作训练数据进行实验,最后把得到的K个实验结果平均。

 

显然,K取值越大,统计偏误就越小,但是需要的计算量较大。一些实验证据表明,当K取10时,在代价和性能之间能达到好的折衷。



https://blog.sciencenet.cn/blog-636598-550787.html

上一篇:NetWorkX安装进行曲(四)--尾声
下一篇:2012年3月30日---旁听博士论文预答辩
收藏 IP: 218.201.115.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 03:31

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部