当前位置: 首页 > wzjs >正文

站长工具综合查询2020北京注册工作室代理公司

站长工具综合查询2020,北京注册工作室代理公司,无障碍浏览网站怎么做,做羞羞事免费网站数据降维方法 文章目录数据降维方法PCAPCA算法代码展示PCA **主成分分析(Principal Component Analysis,PCA)**是一种常用的数据降维方法。它通过线性变换将原始数据变换到一个新的坐标系中,使得第一个坐标(第一主成分…

数据降维方法

文章目录

  • 数据降维方法
    • PCA
      • PCA算法
      • 代码展示

PCA

**主成分分析(Principal Component Analysis,PCA)**是一种常用的数据降维方法。它通过线性变换将原始数据变换到一个新的坐标系中,使得第一个坐标(第一主成分)具有最大的方差,第二个坐标(第二主成分)具有次大的方差,以此类推。PCA的目的是从高维数据中提取出最重要的特征,通过保留最重要的主成分来实现数据的降维,同时尽可能保留原始数据的结构。

PCA算法

  1. 数据标准化

为了消除不同特征之间的量纲影响,通常需要对数据进行标准化处理,使得每个特征的均值为0,标准差为1。

标准化公式:
x′=x−μσ,x' = \frac{x - \mu}{\sigma},x=σxμ,
其中μ\muμ为特征均值,σ\sigmaσ为特征标准差。

  1. 计算协方差矩阵

协方差矩阵描述了数据特征之间的相关性。对于标准化后的数据,协方差矩阵可以通过计算特征之间的协方差得到。

协方差公式:
cov(X,Y)=1n−1∑i=1n(Xi−μX)(Yi−μY),cov(X,Y) = \frac{1}{n-1}\sum_{i=1}^{n}(X_i - \mu_X)(Y_i - \mu_Y),cov(X,Y)=n11i=1n(XiμX)(YiμY)
标准化后简化为特征向量的内积平均。

  1. 计算特征值和特征向量

求解协方差矩阵的特征值和对应的特征向量。特征值表示对应特征向量方向上的数据方差大小,特征向量给出了数据的主要分布方向(即主成分)。

  1. 选择主成分

根据特征值的大小,选择前kkk个最大的特征值对应的特征向量,这些特征向量构成了新的kkk维特征空间。特征值的累计贡献率(如前kkk个特征值之和占总特征值之和的比例)通常作为选择kkk的依据(如累计贡献率≥85%)。

  1. 变换数据

将原始数据投影到新的特征空间中,得到降维后的数据。投影过程通过原始数据矩阵与选定的特征向量矩阵相乘实现。

代码展示

import pandas as pd
from sklearn import datasets# 加载鸢尾花数据集
iris = datasets.load_iris()# 将数据集转换为DataFrame
iris_df = pd.DataFrame(data=iris.data,  # 特征数据columns=iris.feature_names  # 特征名称
)iris_df.info()iris.data_std = (iris.data - iris.data.mean(axis=0)) / iris.data.std(axis=0)from sklearn.decomposition import PCA# 设置PCA参数,这里我们选择保留90%的方差
pca = PCA(n_components=0.9)
iris.data_pca = pca.fit_transform(iris.data_std)# 可视化原始数据和降维后的数据
import matplotlib.pyplot as pltplt.figure(figsize=(12, 6))
plt.scatter(iris.data[:, 0], iris.data[:, 1], c=iris.target, edgecolor='k', alpha=0.7)
plt.xlabel('Sepal Length')
plt.ylabel('Sepal Width')
plt.title('Original Data')
plt.show()plt.figure(figsize=(12, 6));
plt.scatter(iris.data_pca[:, 0], iris.data_pca[:, 1], c=iris.target, edgecolor='k', alpha=0.7)
plt.xlabel('First Principal Component')
plt.ylabel('Second Principal Component')
plt.title('Data after PCA')
plt.show()


文章转载自:

http://cTflEd6i.bwhcL.cn
http://bKjjlh6k.bwhcL.cn
http://R5tSYLuR.bwhcL.cn
http://tZTTIKK5.bwhcL.cn
http://lkFEwM6Q.bwhcL.cn
http://uqMCyRCH.bwhcL.cn
http://HOhNoKih.bwhcL.cn
http://IfUvxDcU.bwhcL.cn
http://cSRxPkAj.bwhcL.cn
http://3TVeVDUD.bwhcL.cn
http://wIYaeGVi.bwhcL.cn
http://jVE7HwZY.bwhcL.cn
http://aj8Px7dx.bwhcL.cn
http://PTIfeR2A.bwhcL.cn
http://BGr4srjl.bwhcL.cn
http://n5wlLNDI.bwhcL.cn
http://JyjTepWi.bwhcL.cn
http://AsnJfB9x.bwhcL.cn
http://iTK8OpP8.bwhcL.cn
http://umxwiiKI.bwhcL.cn
http://Z7o9XOpU.bwhcL.cn
http://tGBi8UGA.bwhcL.cn
http://03PmK0vf.bwhcL.cn
http://iCLUkzAE.bwhcL.cn
http://IoaQFlC3.bwhcL.cn
http://Dr4WJMWB.bwhcL.cn
http://hMuTcsX7.bwhcL.cn
http://ljRWSi85.bwhcL.cn
http://D28ydtyV.bwhcL.cn
http://HI4bJEb8.bwhcL.cn
http://www.dtcms.com/wzjs/732562.html

相关文章:

  • 网站建设理论潍坊模板建站平台
  • 关于做网站电话销售动易网站系统怎么样
  • 做网站需要注册商标多少类广东深圳最新消息今天
  • 个体户可以网站备案吗怎么做运营推广
  • 公司网站域名续费一年多少钱扫码支付 wordpress
  • 上海金山网站建设全国哪个餐饮品牌的网站做的好处
  • 江西城市建设管理协会网站网络营销出来可以干什么工作
  • 顺德网站制作案例如何焦作市网站建设
  • 安阳专业做网站公司关键词优化提升排名
  • 百度快照举报网站做网站提高淘宝店排名
  • 商务网站设计与建设实训电商网站建设开发
  • 百度一下官方网站网络培训心得
  • 东莞网站建设智搜宝网站建设北京海淀
  • 公司网站建设多少费用哪儿济南兴田德润联系电话贵阳营销型_网站建设
  • 有哪些好的网站建设公司扬州专业手机网站开发
  • 很多网站没有后台wordpress 插件哪里
  • 自动化设备东莞网站建设怎么申请自己公司的网址
  • 兰州网站的优化网站建设推广销售好做吗
  • 网站建设软硬件要求网页设计师求职
  • 视频网站不赚钱为什么还做临沂兰山建设局网站
  • 成都网站建设设计自己做的网站谁来维护
  • wordpress大前端整站企业展厅布置效果图大全
  • 网站网站设计的公司协同软件开发
  • 做网站都需要买什么软件网站上传图片问题
  • 旅游网站建设的方法申请园区网站建设经费的请示
  • 网站视图错位个人注册公司的详细步骤
  • 阜阳做网站多少钱河间网站制作
  • wordpress分享后下载地址关键词优化怎么优化
  • 济南金融行业网站开发做好网站建设
  • 建设网站参数wordpress添加小游戏