NJU1healer的个人博客分享 http://blog.sciencenet.cn/u/NJU1healer

博文

KNN算法

已有 4260 次阅读 2020-4-29 16:49 |个人分类:机器学习|系统分类:科研笔记

(1)最符合直觉的分类器-K近邻算法(一种灵活的分类器)

image.png

(2)距离

①欧式距离

image.pngimage.png

②曼哈顿距离

image.pngimage.png

image.png

③明可夫斯基距离(用的少)

(3)KNN投票机制

image.pngimage.png


(4)如何选择K值--交叉验证

image.png

image.png

(5)过拟合与欠拟合

image.png

(one more example)

image.png

过拟合与欠拟合的直观类比


(6)KNN困境

①维度增加,距离失效

②数据量大,算法超慢

详细说明维度灾难与邻近失效:

image.png

image.png

image.png

       当维数N越大时,体积(面积)相对于表面积(周长变小趋势),当N无穷大时,相邻点距离变大,相邻点距离都差不多(很远),“近邻”距离的意义失效。


      点滴分享,福泽你我!Add oil!



https://blog.sciencenet.cn/blog-3428464-1230804.html

上一篇:Anaconda系列(二)
下一篇:机器学习背后的数学(上)
收藏 IP: 171.127.103.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

全部作者的其他最新博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-1-3 19:05

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部