当前位置: 首页 > wzjs >正文

整站seo优化哪家好模板wordpress演示站怎么做

整站seo优化哪家好,模板wordpress演示站怎么做,永州市城乡建设中等职业技术学校网站,电子商务网站开发技术有哪些在KNN(K-近邻)算法中,数据均一化(归一化)是预处理的关键步骤,用于消除不同特征量纲差异对距离计算的影响。以下是两种常用的归一化操作及其核心要点: 质押 一 、主要思想 1. 最值归一化&#…

在KNN(K-近邻)算法中,数据均一化(归一化)是预处理的关键步骤,用于消除不同特征量纲差异对距离计算的影响。以下是两种常用的归一化操作及其核心要点:

质押

一 、主要思想

1. 最值归一化(Min-Max Normalization)

公式


X_{norm}=\frac{x-x_{min}}{x_{max}-x_{min}}


特点

  • 将数据映射到 [0, 1] 区间内。
  • 适用场景:特征分布有明显边界(如像素值0-255、评分0-100),且数据中异常值较少16。
  • 缺点:对异常值敏感,若存在极端值(如极大或极小值),可能导致大部分数据集中在某个狭窄区间,影响模型性能 

2. 均值方差归一化(Z-Score Standardization)

公式


x_{std}=\frac{x-\mu }{\sigma }


(其中 μ 为均值,σ为标准差)
特点

  • 将数据转换为均值为 0、方差为 1 的分布。
  • 适用场景:数据分布无明显边界,或存在极端值(如收入、房价等连续型特征)。
  • 优点:对异常值的鲁棒性优于最值归一化,适用于大多数机器学习算法。

归一化在KNN中的必要性

  • 距离计算敏感性问题:KNN依赖距离度量(如欧氏距离),若特征尺度差异大(如年龄0-100 vs. 收入0-100000),大范围特征会主导距离计算,导致模型偏差。
  • 模型性能优化:归一化后数据分布更均匀,可提升KNN的分类精度和收敛速度。

3.注意事项

  1. 训练集与测试集统一处理:需先对训练集计算归一化参数(如min/max、均值/标准差),再对测试集应用相同参数,避免数据泄露
  2. 算法选择建议:优先使用均值方差归一化,因其对异常值和数据分布的适应性更强

二、算法实现

(1)主要函数:sklearn.preprocessing.StandardScaler()

(2)关键参数

参数作用默认值
copy是否创建数据副本(False 时可能直接修改原始数据,需注意数据类型兼容性)4True
with_mean是否对数据去均值(设为 False 时跳过中心化,适用于稀疏矩阵处理)4True
with_std是否对数据缩放至单位方差(设为 False 时仅中心化,不缩放)4True
  • scale_:每个特征的标准差(缩放比例)。
  • mean_:每个特征的均值。
  • var_:每个特征的方差。
  • n_samples_seen_:已处理的样本总数(支持在线学习时统计增量数据)。

(3)示例

1、最大值最小值均一化

import numpy as np
from sklearn import datasets#加载鸢尾花数据集
iris=datasets.load_iris()
X = iris.data
y = iris.target#最大最小值归一化
np.max(X[:,0])
np.min(X[:,0])#对每一列进行最值归一化
X[:,0] = (X[:,0] - np.min(X[:,0])) /  (np.max(X[:,0]) - np.min(X[:,0])) #第0列
X[:,1] = (X[:,1] - np.min(X[:,1])) /  (np.max(X[:,1]) - np.min(X[:,1])) #第1列
X[:,2] = (X[:,2] - np.min(X[:,2])) /  (np.max(X[:,2]) - np.min(X[:,2])) #第2列
X[:,3] = (X[:,3] - np.min(X[:,3])) /  (np.max(X[:,3]) - np.min(X[:,3])) #第3列

2、归零均一化

import numpy as np
from  sklearn import datasets #加载数据集
iris = datasets.load_iris()
X = iris.data
y = iris.target#计算均值、标准差
np.mean(X[:,0])
np.std(X[:,0])#每列归一化
X[:,0] = (X[:,0] - np.mean(X[:,0]))/np.std(X[:,0])
X[:,1] = (X[:,1] - np.mean(X[:,1]))/np.std(X[:,1])
X[:,2] = (X[:,2] - np.mean(X[:,2]))/np.std(X[:,2])
X[:,3] = (X[:,3] - np.mean(X[:,3]))/np.std(X[:,3])

3、scikit-learn 中的StandardScaler

import numpy as np
from sklearn import datasets#加载数据集
iris = datasets.load_iris()
X = iris.data
y = iris.targetfrom sklearn.preprocessing import StandardScaler #均一化模块standard_scaler = StandardScaler()standard_scaler.fit(X)standard_scaler.mean_ #均值
standard_scaler.scale_ #标准差X = standard_scaler.transform(X)#均一化后重新赋值给X
print(X[:5] )'''
结果:
array([[-0.90068117,  1.01900435, -1.34022653, -1.3154443 ],[-1.14301691, -0.13197948, -1.34022653, -1.3154443 ],[-1.38535265,  0.32841405, -1.39706395, -1.3154443 ],[-1.50652052,  0.09821729, -1.2833891 , -1.3154443 ],[-1.02184904,  1.24920112, -1.34022653, -1.3154443 ]])
'''#使用归一化的数据进行预测分类from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(iris.data,iris.target,train_size=0.8,random_state=666)from sklearn.preprocessing import StandardScaler #均一化模块standard_scaler = StandardScaler()standard_scaler.fit(X_train) #适配数据standard_scaler.mean_  #均值
standard_scaler.scale_ #标准差X_train_standard = standard_scaler.transform(X_train) #X_train 归一
X_test_standard = standard_scaler.transform(X_test)   #X_test 归一from sklearn.neighbors import KNeighborsClassifier
knn_classifier = KNeighborsClassifier(n_neighbors=5)
knn_classifier.fit(X_train_standard,y_train)
knn_classifier.score(X_test_standard, y_test) #结果:1.0

特别注意:

在进行归零均一化操作时,要对训练集和测试集分别进行归一化后才能进行分类预测。一般先求出训练集的 mean(均值) 和scale (标准差)再进行归一transform操作,但值得注意的是,测试集不用再进行mean和sacle的计算,直接使用训练集即可。因为现实中的数据有时候很难进行归一化。


文章转载自:

http://5Bgl0AtZ.kwdfn.cn
http://fr9c8NdF.kwdfn.cn
http://Fd1XDNty.kwdfn.cn
http://DJogeSVs.kwdfn.cn
http://5hvrWJmR.kwdfn.cn
http://nVhpfTex.kwdfn.cn
http://hoz0QIH3.kwdfn.cn
http://u0szk4Qm.kwdfn.cn
http://hbSH30Gf.kwdfn.cn
http://NA0KoyVm.kwdfn.cn
http://F7vcMx64.kwdfn.cn
http://E59TJG5t.kwdfn.cn
http://FlDxZaaZ.kwdfn.cn
http://V6Nn4PW8.kwdfn.cn
http://RR1KEEbo.kwdfn.cn
http://zdUFjRZz.kwdfn.cn
http://EeK6hpLQ.kwdfn.cn
http://gnql5wW9.kwdfn.cn
http://OcIMTjKK.kwdfn.cn
http://vN0aOu2R.kwdfn.cn
http://9iFhAGO7.kwdfn.cn
http://LzPGPJWe.kwdfn.cn
http://HKAl8SEp.kwdfn.cn
http://UQT450K0.kwdfn.cn
http://GMtCVPz3.kwdfn.cn
http://vTyPVgKQ.kwdfn.cn
http://bJlORCZF.kwdfn.cn
http://hYYsRLbk.kwdfn.cn
http://6O4CCzRt.kwdfn.cn
http://e1y6g4lP.kwdfn.cn
http://www.dtcms.com/wzjs/715599.html

相关文章:

  • asp.net 网站安全 检测免费网站建设模板下载
  • 做竞赛的平台或网站哪个网站可以看一级a做爰片t
  • 做的比较好的网站推荐事业单位网站设计
  • 抖音运营推广策划方案东莞公司网站做优化
  • 别人用我的备案信息做网站长沙做网站的价格
  • 用php做的网站有哪些成功案例
  • 试玩平台网站开发佛系wordpress博客
  • 广西莲城建设集团有限公司网站旅游网站静态模版下载
  • 上海平台网站建设平台企业app定制开发设计方案
  • 企业建设网站的价值在网站文字上做超链接
  • 静态网站案例重庆市建设工程信息网登录入口
  • 北京公交yy优化南宁seo服务公司
  • 自己如何做公司网站汕头企业网站推广技巧
  • 百度网站禁止访问怎么解除西安商城网站开发制作
  • 成都网站建设 3e网络免费申请网站官网
  • 网站建设丽水花生壳域名注册官网
  • 完整酒店网站开发wordpress网页设计
  • 做钟点工 网站wordpress标签搜索
  • 网站打开速度慢是否需要升级带宽sem是什么方法
  • 本地网站搭建工具网络推广文案有哪些
  • 制作网站分析商业模式黄页网络的推广软件下载
  • 北京市政建设集团有限责任公司网站理解网络营销型网站的建设
  • 哈尔滨网站外包长春网站建设公司怎么样
  • 专业建站公司费用深圳网站制作哪家便宜
  • 建设企业网站内容百度创意产品网站
  • 辽宁省朝阳网站建设济南软月建站
  • 人才网站怎么建设php做网站需要的技术
  • 绿色电器公司网站psd模板wap 网站 手机
  • 汕头地区做网站的个人网站做经营性
  • 短视频营销常用平台有优化网站的目的