|||
K层交叉检验,就是把原始的数据随机分成K个部分。在这K个部分中,选择一个作为测试数据,剩下的K-1个作为训练数据。
交叉检验的过程实际上是把实验重复做K次,每次实验都从K个部分中选择一个不同的部分作为测试数据(保证K个部分的数据都分别做过测试数据),剩下的K-1个当作训练数据进行实验,最后把得到的K个实验结果平均。
显然,K取值越大,统计偏误就越小,但是需要的计算量较大。一些实验证据表明,当K取10时,在代价和性能之间能达到好的折衷。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-10-19 22:29
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社