机器学习/归一化
概念:使用不同规格的数据转换到统一格式。默认范围区间为[0,1]。
公式:
代码实现:
MinMaxScaler是一个类
归一化的作用:
优点一:可以提升模型的收敛速度。采用梯度下降法求解时,归一化后优化形状变为圆形,梯度方向直指圆心,迭代速度变快,大大减少寻找最优解的时间。
优点二:提升模型精度。涉及到距离计算时,数量级小的特征对结果的影响远远小于数量级大的特征,对精度造成损失,归一化可以使各个特征对结果做出的贡献相同。
适应场景:
最大值与最小值非常容易受异常点影响,所以这种方法鲁棒性较差,只适合传统精确小数据场景