当前位置: 首页 > wzjs >正文

泰安市住房和城乡建设部网站免费网站java源码大全

泰安市住房和城乡建设部网站,免费网站java源码大全,山东省政府办公厅综合处处长,徐州做企业网站1.数据标准化 1.1 概念: 标准化是将数据转化为均值为0,标准差为1的分布。通过标准化处理,所有特征在同一个尺度上,使得模型更加稳定和高效,尤其适用于正态(高斯)分布的数据。 1.2 原理 标准化…

1.数据标准化

1.1 概念:

     标准化是将数据转化为均值为0,标准差为1的分布。通过标准化处理,所有特征在同一个尺度上,使得模型更加稳定和高效,尤其适用于正态(高斯)分布的数据。

1.2 原理

     标准化后的数据具有相同尺度,减少特征之间量纲不一致的影响,有助于提高某些机器学习算法的性能。

1.3 核心公式

标准化公式:

其中,µ 是特征的均值,σ是特征的标准差。

假设X={X1,X2,...,Xn},其均值和标准差分别为:

1.4.python案例 

    创建一个包含两个特征的数据集,对数据进行标准化。

步骤:

    1.创建一个随机数据集

    2.对数据进行标准化

    3.绘制标准化前后的数据分布直方图

    4.绘制标准化前后的数据散点图

scikit-learn中,我们可以使用sklearn.preprocessing模块中的StandardScaler类实现数据标准化。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.preprocessing import StandardScaler
# 1. 创建一个随机数据集
np.random.seed(0)
data = np.random.rand(100, 2) * 1000
# 创建一个DataFrame
df = pd.DataFrame(data, columns=['Feature1', 'Feature2'])
# 2. 对数据进行标准化
scaler = StandardScaler()
data_standardized = scaler.fit_transform(data)
# 创建标准化后的DataFrame
df_standardized = pd.DataFrame(data_standardized, columns=['Feature1',colour='bule')
plt.hist(df_standardized['Feature2'], bins=20, alpha=0.7, label='Feature2',color='green')
# 3. 绘制标准化前后的数据分布直方图
plt.figure(figsize=(12,6))
# 标准化前
plt.subplot(1,2,1)
plt.hist(df['Feature1'], bins=20, alpha=0.7, label='Feature1', color='blue')
plt.hist(df['Feature2'], bins=20, alpha=0.7, label='Feature2', color='green')
plt.title('Before Standardization')
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.legend()
# 标准化后
plt.subplot(1, 2, 2)
plt.hist(df_standardized['Feature1'], bins=20, alpha=0.7, label='Feature1',color='blue')plt.hist(df_standardized['Feature2'], bins=20, alpha=0.7, label='Feature2',color='green')
plt.title('After Standardization')
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.legend()
plt.tight_layout()
plt.show()
# 4. 绘制标准化前后的数据散点图
plt.figure(figsize=(12, 6))
# 标准化前
plt.subplot(1, 2, 1)
plt.scatter(df['Feature1'], df['Feature2'], color='blue', alpha=0.7)
plt.title('Before Standardization')
plt.xlabel('Feature1')
plt.ylabel('Feature2')
# 标准化后
plt.subplot(1, 2, 2)
plt.scatter(df_standardized['Feature1'], df_standardized['Feature2'],color='red',alpha=0.7)
plt.title('After Standardization')
plt.xlabel('Feature1')
plt.ylabel('Feature2')
plt.tight_layout()
plt.show()

输出结果: 

2.数据归一化 

2.1 概念

  归一化是将数据缩放到特定范围(通常是[0,1]),特别适用于距离度量敏感的算法

2.2 原理

归一化后的数据每个特征的取值范围相同,有助于提高某些机器学习算法的性能。

2.3 核心公式

归一化公式:

其中,Xmax和Xmin分别是特征的最大值和最小值。

假设X={X1,X2,...Xn},其最小值和最大值分别为:

Xmin=min(X)

Xmax=max(X)

注意:我们也可以通过公式将数据压缩到其他指定的范围[a,b]:

 其中,a和b是目标范围的上下界。

2.4 Python案例  

当涉及到数据预处理中的归一化,一个经典的案例就是处理不同尺度或者有明显数值差异的的特征。我们可以用鸢尾花数据集来演示。这个数据集包含了三种不同品种的鸢尾花,每种花有四个特征:花萼长度,花萼宽度,花瓣长度和花瓣宽度。

这里使用python和一些常见的数据科学库来演示归一化过程,并且展示归一化前后的数据分布情况

import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.preprocessing import MinMaxScaler
# 加载鸢尾花数据集
iris=datasets.load_iris()
X=iris.data # 特征数据
# 创建MinMaxScaler对象
scaler = MinMaxScaler()
# 对数据集进行归一化
X_normalized = scaler.fit_transform(X)
# 可视化归一化前后的数据分布
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(12, 6))
# 归一化前的数据分布
ax1.scatter(X[:,0],X[:,1],c=iris.target)
ax1.set_title('Before Normalization')
ax1.set_xlabel('Sepal Length (cm)')
ax1.set_ylabel('Sepal Width (cm)')
# 归一化后的数据分布
ax2.scatter(X_normalized[:,0],X_normalized[:,1],c=iris.target)
ax2.set_title('After Normalization')
ax2.set_xlabel('Sepal Length (normalized)')
ax2.set_ylabel('Sepal Width (normalized)')
plt.tight_layout()
plt.show()

输出结果 

3.标准化和归一化对比 

 标准化和归一化都能实现对数据的缩放,不过它们各自的功能以及适用场景并不一样。

http://www.dtcms.com/wzjs/177690.html

相关文章:

  • 仿牌网站容易被攻击吗2024很有可能再次封城吗
  • 关于单位网站建设的报告搭建网站基本步骤
  • 山西太原做企业网站建设的公司网站推广是干嘛的
  • 网站备案号官网南京疫情最新情况
  • 3d动画制作视频教程免费seo工具汇总
  • 九江网站建设张旭四川网络推广推广机构
  • 微网站是自己做可以不网络营销的手段包括
  • 网站开发是否属于无形资产seo的培训网站哪里好
  • 老外做的汉语网站谷歌收录提交入口
  • 七台河新闻联播最新重庆seo优
  • 上海web网站开发百度竞价排名多少钱
  • 站群 网站如何做房地产新闻最新消息
  • 国家对网站建设的要求平台营销策略
  • 响应式 html5 css3 网站模板百度关键词搜索量查询
  • 电商网站建设规划书上海品牌推广公司
  • 平面设计用什么软件最好广州谷歌seo公司
  • .com网站制作google seo怎么做
  • 至高建设集团 网站无锡seo优化
  • 动态网站欣赏免费发广告的平台
  • 政府的网站应该怎么做域名注册新网
  • 网站建设 成本分析长沙谷歌优化
  • 腾讯有服务器如何做网站北京网站营销seo方案
  • 发卡网站建设网络seo是什么意思
  • 临沂网站建设哪家最好留号码的广告网站不需要验证码
  • 网站上怎么做动画广告甘肃seo技术
  • 西安信息网站建设搜索引擎seo外包
  • 大庆公司做网站百度软文
  • 百度给公司做网站效果咋样搜索引擎收录提交入口
  • 做交友类网站适合什么cms品牌推广方案包括哪些
  • 企业建设营销网站的目的是什么登录百度app