当前位置: 首页 > wzjs >正文

南阳优化网站排名百度网址大全怎么设为主页

南阳优化网站排名,百度网址大全怎么设为主页,wordpress dcloud,天津交通网站建设特征缩放(Feature Scaling)详解 特征缩放是机器学习数据预处理的关键步骤,旨在将不同特征的数值范围统一到相近的尺度,从而加速模型训练、提升性能并避免某些特征主导模型。 1. 为什么需要特征缩放? (1) 问题背景 量…

特征缩放(Feature Scaling)详解

特征缩放是机器学习数据预处理的关键步骤,旨在将不同特征的数值范围统一到相近的尺度,从而加速模型训练、提升性能并避免某些特征主导模型。


1. 为什么需要特征缩放?

(1) 问题背景

  • 量纲不一致:例如:
    • 特征1:年龄(范围 0-100)
    • 特征2:收入(范围 0-1,000,000)
  • 梯度下降的困境
    • 量纲大的特征(如收入)会导致梯度更新方向偏离最优路径,收敛缓慢。
    • 量纲小的特征(如年龄)的权重更新可能被忽略。

(2) 影响

  • 模型收敛慢:梯度下降需要更多迭代。
  • 某些算法失效
    • 距离类算法(如KNN、SVM)受特征尺度直接影响。
    • 正则化模型(如岭回归)对未缩放的系数惩罚不均。

2. 常用特征缩放方法

(1) 标准化(Standardization)

  • 公式
    [
    x’ = \frac{x - \mu}{\sigma}
    ]
    • ( \mu ):特征均值,( \sigma ):标准差。
  • 结果:数据均值为0,方差为1(服从标准正态分布)。
  • 适用场景:大多数算法(如线性回归、神经网络)。

Python实现

from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

(2) 归一化(Normalization)

  • 公式(Min-Max缩放):
    [
    x’ = \frac{x - \min(x)}{\max(x) - \min(x)}
    ]
  • 结果:数据被压缩到 [0, 1] 区间。
  • 适用场景:图像像素值、神经网络输入层。

Python实现

from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
X_scaled = scaler.fit_transform(X)

(3) 鲁棒缩放(Robust Scaling)

  • 公式
    [
    x’ = \frac{x - \text{median}(x)}{\text{IQR}(x)}
    ]
    • IQR(四分位距)= Q3 - Q1。
  • 特点:抗异常值干扰。
  • 适用场景:数据含离群点时。

3. 不同算法的需求

算法类型是否需要特征缩放原因
梯度下降类必须(如线性回归、神经网络)加速收敛,避免震荡。
距离类(KNN、SVM)必须距离计算依赖特征尺度。
树模型(决策树、随机森林)不需要基于特征排序,不受尺度影响。
正则化模型(Lasso/Ridge)必须公平惩罚各特征系数。

4. 代码示例对比

未缩放的梯度下降问题

import numpy as np# 未缩放的数据(年龄 vs 收入)
X = np.array([[30, 50000], [40, 60000], [25, 30000]])
y = np.array([1, 2, 0])# 梯度下降(收敛慢)
def gradient_descent(X, y, lr=0.000001, epochs=100):w = np.zeros(X.shape[1])for _ in range(epochs):y_pred = X.dot(w)grad = X.T.dot(y_pred - y) / len(y)w -= lr * gradreturn ww = gradient_descent(X, y)  # 需要极小的学习率和大量迭代

缩放后的优化效果

from sklearn.preprocessing import StandardScalerscaler = StandardScaler()
X_scaled = scaler.fit_transform(X)w_scaled = gradient_descent(X_scaled, y, lr=0.1)  # 学习率更大,收敛更快

5. 注意事项

  1. 划分数据后缩放:先拆分训练集/测试集,仅用训练集统计量(均值、方差)缩放测试集,避免数据泄漏。
    scaler.fit(X_train)  # 仅用训练集计算参数
    X_train_scaled = scaler.transform(X_train)
    X_test_scaled = scaler.transform(X_test)  # 测试集用相同的scaler
    
  2. 分类特征:独热编码后的二元特征通常无需缩放。
  3. 树模型例外:决策树类模型不依赖特征尺度,但缩放有时能提升计算效率。

6. 总结

  • 核心目标:消除特征间的量纲差异,使模型公平对待每个特征。
  • 方法选择
    • 默认用标准化(StandardScaler)。
    • 数据有界时用归一化(MinMaxScaler)。
    • 含离群点时用鲁棒缩放(RobustScaler)。
  • 关键口诀

    “梯度下降必缩放,距离模型量纲关;
    树模型前可忽略,防漏数据记心间。”



文章转载自:

http://KXvICADj.wphzr.cn
http://8YsxqxtR.wphzr.cn
http://m6Xvrvu1.wphzr.cn
http://VdfjhjDW.wphzr.cn
http://KOCFQwiM.wphzr.cn
http://GPSlH2AD.wphzr.cn
http://K7brMeij.wphzr.cn
http://J6QpG2RR.wphzr.cn
http://4jzcqnQl.wphzr.cn
http://FlDZHRTR.wphzr.cn
http://drxAMczg.wphzr.cn
http://gWJCSaHm.wphzr.cn
http://yHUPgcnm.wphzr.cn
http://yir4K1RC.wphzr.cn
http://TjhEIFYD.wphzr.cn
http://ckrmVZN7.wphzr.cn
http://LEKtYADs.wphzr.cn
http://1aMFltS3.wphzr.cn
http://jxkmdi5b.wphzr.cn
http://6tdRw01c.wphzr.cn
http://ScEx5scS.wphzr.cn
http://O43qjE7s.wphzr.cn
http://pWZvgiYO.wphzr.cn
http://jmj0TmhO.wphzr.cn
http://EO64M5Pq.wphzr.cn
http://6qniizAD.wphzr.cn
http://DZ6DSR8o.wphzr.cn
http://4L1KliyP.wphzr.cn
http://RXU29YYo.wphzr.cn
http://OsQetNae.wphzr.cn
http://www.dtcms.com/wzjs/771138.html

相关文章:

  • 网站开发工具c正规的网上购物平台
  • 网站改版中销售网站开发的背景
  • 天津大型网站设计公司重庆平台网站建设
  • 网站根目录是什么浙江大境软装设计公司
  • 丢了么网站专业网站设计师去哪找
  • 河南省建设协会网站网站建设ps模板下载
  • 网站 用户体验的重要性城乡建设部网站首页甲级
  • 企业建设网站的目的手机上自己设计房子软件
  • 永嘉高端网站建设效果要建设一个网站需要什么手续费
  • 做门户网站代码质量方面具体需要注意什么网站设计需要哪些技能
  • 用小米路由器做网站wordpress页面是什么意思
  • 深圳哪家做网站好wordpress自建电商网站
  • 做视频网站可以自学吗项目外包和人力外包的区别
  • 做服务器的网站都有哪些分类网站营销
  • 网站规划与设计大作业四平网络推广公司
  • 网站建设 蜀美网络h5网站实例
  • 番禺网站开发服务台州网站建设技术外包
  • 青海互动网站建设温州网站建设技术托管
  • wordpress中英文站点设计作品集模板
  • 建设网站找谁公司信息查询网
  • 海南网站推广抖音小程序怎么挂到抖音上
  • wordpress开启多站点功网站为什么被挂马
  • 做网站都要学什么编程网站scratch网址
  • 网站建设计划图公司网络组建设计与方案
  • 昆明电商网站建设网站的交流的功能怎么做
  • 用阿里云建站wordpressWordPress 长文 阅读
  • 做网站拿来卖中国购物网站排行榜
  • 社交网站实名备案wordpress获取主页路径
  • 浙江电信关于网站备案信息核实的公告永州网站制作
  • php自建网站天机seo