当前位置：首页 > wzjs >正文

网站代码模板编写滦平住房和城乡建设厅网站

wzjs 2025/9/22 13:04:30

网站代码模板编写,滦平住房和城乡建设厅网站,word wordpress,wordpress交易主题数据标准化（Standardization） 数据标准化（有时称为Z-score标准化或零均值标准化）是将数据转换成均值为0，标准差为1的分布。标准化的目的是消除数据中的量纲单位差异，使得每个特征对模型的贡献相对平衡。标…

数据标准化（Standardization）

数据标准化（有时称为Z-score标准化或零均值标准化）是将数据转换成均值为0，标准差为1的分布。标准化的目的是消除数据中的量纲单位差异，使得每个特征对模型的贡献相对平衡。标准化常用于距离度量敏感的算法，例如K近邻（K-NN）、支持向量机（SVM）、线性回归等。
$x_{标准化} = \frac{x-\mu }{σ}$
公式详解
$x$ : 原始数据中的某个值。
$μ$ : 数据所在特征的均值（所有样本的算术平均值）。
$σ$ : 数据所在特征的标准差（反映数据的离散程度）。

计算步骤
Step 1：计算特征的均值 $\frac{1}{n}\Sigma{^n_{i=1}}x_i$
Step 2：计算标准差 $\sigma = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2}$
Step 3：对每个数据点应用公式 $x_{标准化} = \frac{x-\mu }{σ}$

标准化（Z-Score）计算步骤详解

原始数据表：

学生编号	数学成绩（X₁）	语文成绩（X₂）
1	50	40
2	60	55
3	70	75
4	80	85
5	90	95

第一步：计算数学成绩（X₁）的标准化

1. 计算均值（μ₁）

$\mu_1 = \frac{50 + 60 + 70 + 80 + 90}{5} = \frac{350}{5} = 70$

2. 计算标准差（σ₁）

$\sigma_1 = \sqrt{\frac{(50-70)^2 + (60-70)^2 + (70-70)^2 + (80-70)^2 + (90-70)^2}{5}}$
$\sqrt{\frac{400 + 100 + 0 + 100 + 400}{5}} = \sqrt{\frac{1000}{5}} = \sqrt{200} \approx 14.14$

3. 标准化计算（逐值）

公式：
$x_{\text{标准化}} = \frac{x - \mu}{\sigma}$

学生编号	计算过程	标准化结果
1	(50 - 70) / 14.14	-1.41
2	(60 - 70) / 14.14	-0.71
3	(70 - 70) / 14.14	0.00
4	(80 - 70) / 14.14	0.71
5	(90 - 70) / 14.14	1.41

第二步：计算语文成绩（X₂）的标准化

1. 计算均值（μ₂）

$\mu_2 = \frac{40 + 55 + 75 + 85 + 95}{5} = \frac{350}{5} = 70$

2. 计算标准差（σ₂）

$\sigma_2 = \sqrt{\frac{(40-70)^2 + (55-70)^2 + (75-70)^2 + (85-70)^2 + (95-70)^2}{5}}$
$\sqrt{\frac{900 + 225 + 25 + 225 + 625}{5}} = \sqrt{\frac{2000}{5}} = \sqrt{400} = 20$

3. 标准化计算结果

学生编号	计算过程	标准化结果
1	(40 - 70) / 20	-1.50
2	(55 - 70) / 20	-0.75
3	(75 - 70) / 20	0.25
4	(85 - 70) / 20	0.75
5	(95 - 70) / 20	1.25

验证标准化效果

验证数学成绩（X₁标准化）的均值和标准差

1. 计算均值

$\mu_{X1标准化} = \frac{-1.41 + (-0.71) + 0 + 0.71 + 1.41}{5} = \frac{0}{5} = 0$

2. 计算标准差

$\sigma_{X1标准化} = \sqrt{\frac{(-1.41)^2 + (-0.71)^2 + 0^2 + 0.71^2 + 1.41^2}{5}}$
$\sqrt{\frac{1.988 + 0.504 + 0 + 0.504 + 1.988}{5}} = \sqrt{\frac{5}{5}} = 1$

验证语文成绩（X₂标准化）的均值和标准差

1. 计算均值

$\mu_{X2标准化} = \frac{-1.5 + (-0.75) + 0.25 + 0.75 + 1.25}{5} = \frac{0}{5} = 0$

2. 计算标准差

$\sigma_{X2标准化} = \sqrt{\frac{(-1.5)^2 + (-0.75)^2 + 0.25^2 + 0.75^2 + 1.25^2}{5}}$
$\sqrt{\frac{2.25 + 0.5625 + 0.0625 + 0.5625 + 1.5625}{5}} = \sqrt{\frac{5}{5}} = 1$