||
在读fastai 的配套书籍,有几点更加清楚了。第一章,validation sets and test sets, 全书10%左右位置
1)为何要有 test 数据集,在有了training 和 validation dataset 之后?
主要是你在手工选择model或超参数时,其实用了validation 数据,所以最终model已经间接使用了validationdata里面的信息。
2)如何选取test 数据?
对于 时间序列,随机选取不好,而是要选取一段前面的,训练,测试则用后面的。随机选太容易通过差值就算出来了。
对于 走神的司机那个数据集,你要注意测试集是之前训练集完全没看到过的新面孔,否则系统容易偷懒,记住面孔就可以了。
一些新单词 bluntly entrant hedge dumb curated conundrum
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-10-19 21:34
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社