hermitwyc的个人博客分享 http://blog.sciencenet.cn/u/hermitwyc

博文

标准化与归一化

已有 5038 次阅读 2019-5-5 15:11 |系统分类:科研笔记

标准化和归一化.doc


标准化

什么是标准化?

标准化是通过特征的平均值和标准差,将特征缩放成一个标准的正态分布,缩放后均值为0,方差为1。但即使数据不服从正态分布,也可以用此法。特别适用于数据的最大值和最小值未知,或存在孤立点。

 

标准化的方法:

 

 

归一化

什么是归一化?

把数据变成(0,1)或者(1,1)之间的小数。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速。把有量纲表达式变成无量纲表达式,便于不同单位或量级的指标能够进行比较和加权。归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。

 

常见的归一化方法:

1. min-max归一化

 

2. 对数函数转换

 

3. atan函数转换

用反正切函数也可以实现数据归一化。

 

 

 

什么时候用归一化?什么时候用标准化

(1)如果对输出结果范围有要求,用归一化。
 (2)如果数据较为稳定,不存在极端的最大最小值,用归一化。
 (3)如果数据存在异常值和较多噪音,用标准化,可以间接通过中心化避免异常值和极端值的影响。

 

例:{2.5,3.5,0.5,1.5}

min-max归一化后{0.67,1,0,0.33}

标准化后:{0.45,1.34,-1.34,-0.45}


 




https://blog.sciencenet.cn/blog-3413658-1177235.html

上一篇:k近邻法ppt
下一篇:第八章提升方法
收藏 IP: 113.128.129.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-9-19 11:22

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部