当前位置: 首页 > wzjs >正文

免费网站的代码做任务的阅币漫画网站

免费网站的代码,做任务的阅币漫画网站,手机微信网站开发教程,网站模板拍卖数据标准化(Standardization) 数据标准化(有时称为Z-score标准化或零均值标准化)是将数据转换成均值为0,标准差为1的分布。标准化的目的是消除数据中的量纲单位差异,使得每个特征对模型的贡献相对平衡。标…

数据标准化(Standardization)

数据标准化(有时称为Z-score标准化或零均值标准化)是将数据转换成均值为0,标准差为1的分布。标准化的目的是消除数据中的量纲单位差异,使得每个特征对模型的贡献相对平衡标准化常用于距离度量敏感的算法,例如K近邻(K-NN)支持向量机(SVM)线性回归等。
x 标准化 = x − μ σ x_{标准化} = \frac{x-\mu }{σ} x标准化=σxμ
公式详解
x x x: 原始数据中的某个值。
μ μ μ: 数据所在特征的 均值​(所有样本的算术平均值)。
σ σ σ: 数据所在特征的 ​标准差​(反映数据的离散程度)。

计算步骤
Step 1:计算特征的均值 μ = 1 n Σ i = 1 n x i μ= \frac{1}{n}\Sigma{^n_{i=1}}x_i μ=n1Σi=1nxi
​Step 2:计算标准差 σ = 1 n ∑ i = 1 n ( x i − μ ) 2 \sigma = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2} σ=n1i=1n(xiμ)2
​Step 3:对每个数据点应用公式 x 标准化 = x − μ σ x_{标准化} = \frac{x-\mu }{σ} x标准化=σxμ

标准化(Z-Score)计算步骤详解

原始数据表:

学生编号数学成绩(X₁)语文成绩(X₂)
15040
26055
37075
48085
59095

第一步:计算数学成绩(X₁)的标准化

1. 计算均值(μ₁)

μ 1 = 50 + 60 + 70 + 80 + 90 5 = 350 5 = 70 \mu_1 = \frac{50 + 60 + 70 + 80 + 90}{5} = \frac{350}{5} = 70 μ1=550+60+70+80+90=5350=70

2. 计算标准差(σ₁)

σ 1 = ( 50 − 70 ) 2 + ( 60 − 70 ) 2 + ( 70 − 70 ) 2 + ( 80 − 70 ) 2 + ( 90 − 70 ) 2 5 \sigma_1 = \sqrt{\frac{(50-70)^2 + (60-70)^2 + (70-70)^2 + (80-70)^2 + (90-70)^2}{5}} σ1=5(5070)2+(6070)2+(7070)2+(8070)2+(9070)2
= 400 + 100 + 0 + 100 + 400 5 = 1000 5 = 200 ≈ 14.14 = \sqrt{\frac{400 + 100 + 0 + 100 + 400}{5}} = \sqrt{\frac{1000}{5}} = \sqrt{200} \approx 14.14 =5400+100+0+100+400 =51000 =200 14.14

3. 标准化计算(逐值)

公式:
x 标准化 = x − μ σ x_{\text{标准化}} = \frac{x - \mu}{\sigma} x标准化=σxμ

学生编号计算过程标准化结果
1(50 - 70) / 14.14-1.41
2(60 - 70) / 14.14-0.71
3(70 - 70) / 14.140.00
4(80 - 70) / 14.140.71
5(90 - 70) / 14.141.41

第二步:计算语文成绩(X₂)的标准化

1. 计算均值(μ₂)

μ 2 = 40 + 55 + 75 + 85 + 95 5 = 350 5 = 70 \mu_2 = \frac{40 + 55 + 75 + 85 + 95}{5} = \frac{350}{5} = 70 μ2=540+55+75+85+95=5350=70

2. 计算标准差(σ₂)

σ 2 = ( 40 − 70 ) 2 + ( 55 − 70 ) 2 + ( 75 − 70 ) 2 + ( 85 − 70 ) 2 + ( 95 − 70 ) 2 5 \sigma_2 = \sqrt{\frac{(40-70)^2 + (55-70)^2 + (75-70)^2 + (85-70)^2 + (95-70)^2}{5}} σ2=5(4070)2+(5570)2+(7570)2+(8570)2+(9570)2
= 900 + 225 + 25 + 225 + 625 5 = 2000 5 = 400 = 20 = \sqrt{\frac{900 + 225 + 25 + 225 + 625}{5}} = \sqrt{\frac{2000}{5}} = \sqrt{400} = 20 =5900+225+25+225+625 =52000 =400 =20

3. 标准化计算结果
学生编号计算过程标准化结果
1(40 - 70) / 20-1.50
2(55 - 70) / 20-0.75
3(75 - 70) / 200.25
4(85 - 70) / 200.75
5(95 - 70) / 201.25

验证标准化效果

验证数学成绩(X₁标准化)的均值和标准差

1. 计算均值

μ X 1 标准化 = − 1.41 + ( − 0.71 ) + 0 + 0.71 + 1.41 5 = 0 5 = 0 \mu_{X1标准化} = \frac{-1.41 + (-0.71) + 0 + 0.71 + 1.41}{5} = \frac{0}{5} = 0 μX1标准化=51.41+(0.71)+0+0.71+1.41=50=0

2. 计算标准差

σ X 1 标准化 = ( − 1.41 ) 2 + ( − 0.71 ) 2 + 0 2 + 0.7 1 2 + 1.4 1 2 5 \sigma_{X1标准化} = \sqrt{\frac{(-1.41)^2 + (-0.71)^2 + 0^2 + 0.71^2 + 1.41^2}{5}} σX1标准化=5(1.41)2+(0.71)2+02+0.712+1.412
= 1.988 + 0.504 + 0 + 0.504 + 1.988 5 = 5 5 = 1 = \sqrt{\frac{1.988 + 0.504 + 0 + 0.504 + 1.988}{5}} = \sqrt{\frac{5}{5}} = 1 =51.988+0.504+0+0.504+1.988 =55 =1


验证语文成绩(X₂标准化)的均值和标准差

1. 计算均值

μ X 2 标准化 = − 1.5 + ( − 0.75 ) + 0.25 + 0.75 + 1.25 5 = 0 5 = 0 \mu_{X2标准化} = \frac{-1.5 + (-0.75) + 0.25 + 0.75 + 1.25}{5} = \frac{0}{5} = 0 μX2标准化=51.5+(0.75)+0.25+0.75+1.25=50=0

2. 计算标准差

σ X 2 标准化 = ( − 1.5 ) 2 + ( − 0.75 ) 2 + 0.2 5 2 + 0.7 5 2 + 1.2 5 2 5 \sigma_{X2标准化} = \sqrt{\frac{(-1.5)^2 + (-0.75)^2 + 0.25^2 + 0.75^2 + 1.25^2}{5}} σX2标准化=5(1.5)2+(0.75)2+0.252+0.752+1.252
= 2.25 + 0.5625 + 0.0625 + 0.5625 + 1.5625 5 = 5 5 = 1 = \sqrt{\frac{2.25 + 0.5625 + 0.0625 + 0.5625 + 1.5625}{5}} = \sqrt{\frac{5}{5}} = 1 =52.25+0.5625+0.0625+0.5625+1.5625 =55 =1


应用场景

  • 距离度量算法:如K近邻(K-NN)、支持向量机(SVM)、K均值聚类等,这些算法依赖于数据点之间的距离。如果数据的量纲不统一或尺度不一致,模型可能会受到影响。
  • 梯度下降算法:例如在线性回归、逻辑回归、神经网络等中,标准化有助于加速梯度下降过程,避免某些特征因量纲不同而导致收敛速度慢。

优点

  • 对于大多数机器学习算法,标准化能提高模型的表现,特别是对于距离敏感的算法。
  • 可以消除不同特征间的尺度差异,使得所有特征具有相同的权重。

缺点

  • 标准化后,数据不再保留原来的数据分布(如正态分布等),因此对于某些需要数据分布特征的算法可能不适用。
  • 对异常值(outliers)敏感,异常值会影响均值和标准差的计算,从而影响标准化的效果

数据归一化(Normalization)

数据归一化(又叫最小-最大归一化)是将数据按比例缩放到指定的区间内,通常是[0, 1]区间。归一化的目的是让数据的值落在一个统一的范围内,避免特征值过大或过小对模型造成影响,尤其是那些依赖于数据范围的算法,如神经网络。

归一化公式(Min-Max Normalization)

1. 基础公式(缩放至[a,b]区间)

x norm = a + ( x − x min ⁡ ) × ( b − a ) x max ⁡ − x min ⁡ x_{\text{norm}} = a + \frac{(x - x_{\min}) \times (b - a)}{x_{\max} - x_{\min}} xnorm=a+xmaxxmin(xxmin)×(ba)

2. 常用公式(缩放至[0,1]区间)

x norm = x − x min ⁡ x max ⁡ − x min ⁡ x_{\text{norm}} = \frac{x - x_{\min}}{x_{\max} - x_{\min}} xnorm=xmaxxminxxmin

应用场景

  • 神经网络:尤其是深度学习中的神经网络,在训练过程中经常使用归一化处理,因为神经网络的激活函数(如sigmoid、tanh)对输入数据的范围非常敏感。
  • 梯度下降优化算法:对于某些需要快速收敛的优化问题,归一化有助于加速训练过程。
  • 需要控制数据范围的算法:例如一些基于边界计算的算法(如支持向量机中的核函数)对输入数据的范围比较敏感,因此也需要进行归一化。

优点

  • 归一化后的数据保持在固定的范围内,避免了特征值差异较大对算法的影响。
  • 对于某些算法(如神经网络),归一化可以加速学习过程,提高模型的收敛速度。

缺点

  • 归一化无法处理数据中的异常值,因为极端值(如离群点)可能会影响最大值和最小值,导致归一化后数据的分布不均匀。
  • 对于数据分布呈正态分布或具有较大方差的情况,归一化可能不合适。

文章转载自:

http://pq3p6Knw.mczjq.cn
http://2LTtXdJN.mczjq.cn
http://iArEh0ZV.mczjq.cn
http://rCvCzN0L.mczjq.cn
http://5ndfN2RC.mczjq.cn
http://zqsTGbBV.mczjq.cn
http://kslwMjkz.mczjq.cn
http://3yM8dIkd.mczjq.cn
http://SuvVBA2Q.mczjq.cn
http://Xl7IJq4c.mczjq.cn
http://o0iTux32.mczjq.cn
http://1sTtd7Pl.mczjq.cn
http://aOsVl73k.mczjq.cn
http://ztMejt0r.mczjq.cn
http://2qJWf604.mczjq.cn
http://aTDFkjnr.mczjq.cn
http://BEVHKfX3.mczjq.cn
http://I7AQ67hS.mczjq.cn
http://sTXqrqV4.mczjq.cn
http://EMfgcuvD.mczjq.cn
http://2THYEP0c.mczjq.cn
http://dEZ8q448.mczjq.cn
http://ceZkpkzy.mczjq.cn
http://ozOcdsB8.mczjq.cn
http://rSUQzxj3.mczjq.cn
http://B29vZ5it.mczjq.cn
http://N5oGoCb1.mczjq.cn
http://kQtNMEiw.mczjq.cn
http://1dZE3d59.mczjq.cn
http://dU5cVf7I.mczjq.cn
http://www.dtcms.com/wzjs/749918.html

相关文章:

  • 食品网站建设策划方案西安网站开发的空间
  • it美工做网站石狮住房和城乡建设局网站
  • 公司建立网站步骤宁波高新区网站制作
  • 网站建设的优质山东专业网站开发公司
  • 常州网站建设选思创徐州模板开发建站
  • 冀州建网站电商网站改版思路
  • 广东建设工程信息网站网站页面框架设计影响用户
  • 做机械设计兼职的网站泰安神秀网络科技有限公司
  • 网站服务器选择wordpress 24小时插件
  • vs如何做网站国外seo大神
  • ui设计的网站广告公司网页设计
  • 北京住房城乡建设网站合作建站协议
  • 北京网站设计制作费用昆明门户网站
  • 360极速怎么屏蔽网站网站源码怎么有
  • 站长工具关键词排名怎么查厚街网站建设
  • 青岛企业建站系统模板帮他人做视频网站违法吗
  • 大流量ip网站怎么做高水平建设专业网站
  • 视频盗版网站怎么做设计一套网站多少钱
  • 公司网站怎么更新需要怎么做热门的建设工程人员查询
  • 自己做网站是不是需要写代码北京网站建设哪家最好
  • 什么是网站名称文件夹网站开发工具 下载
  • 哈尔滨 网站建设中国网络推广网站排名
  • 怎么做淘宝网站的网页现在花钱做那个网站好呀
  • 公司和个人均不能备案论坛类网站网址你懂我意思正能量免费
  • 布吉网站设计常州金坛网站建设
  • 家装设计效果图网站表白网页在线生成器
  • 网站建设衤金手指花总十五河池公司网站开发价格
  • 微信连接微网站吗漯河市源汇区建设局网站
  • 网站信息c 网站开发平台
  • 安庆市网站建设公司山东济宁最新消息今天