|
标准化
什么是标准化?
标准化是通过特征的平均值和标准差,将特征缩放成一个标准的正态分布,缩放后均值为0,方差为1。但即使数据不服从正态分布,也可以用此法。特别适用于数据的最大值和最小值未知,或存在孤立点。
标准化的方法:
归一化
什么是归一化?
把数据变成(0,1)或者(1,1)之间的小数。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速。把有量纲表达式变成无量纲表达式,便于不同单位或量级的指标能够进行比较和加权。归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。
常见的归一化方法:
1. min-max归一化
2. 对数函数转换
3. atan函数转换
用反正切函数也可以实现数据归一化。
什么时候用归一化?什么时候用标准化?
(1)如果对输出结果范围有要求,用归一化。
(2)如果数据较为稳定,不存在极端的最大最小值,用归一化。
(3)如果数据存在异常值和较多噪音,用标准化,可以间接通过中心化避免异常值和极端值的影响。
例:{2.5,3.5,0.5,1.5}
min-max归一化后:{0.67,1,0,0.33}
标准化后:{0.45,1.34,-1.34,-0.45}
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-24 20:18
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社