||
(1)最符合直觉的分类器-K近邻算法(一种灵活的分类器)
(2)距离
①欧式距离
②曼哈顿距离
③明可夫斯基距离(用的少)
(3)KNN投票机制
(4)如何选择K值--交叉验证
(5)过拟合与欠拟合
(one more example)
过拟合与欠拟合的直观类比
(6)KNN困境
①维度增加,距离失效
②数据量大,算法超慢
详细说明维度灾难与邻近失效:
当维数N越大时,体积(面积)相对于表面积(周长变小趋势),当N无穷大时,相邻点距离变大,相邻点距离都差不多(很远),“近邻”距离的意义失效。
点滴分享,福泽你我!Add oil!
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-3 19:05
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社