当前位置: 首页 > wzjs >正文

公司网站建设深圳网络营销课程

公司网站建设深圳,网络营销课程,做网站公司怎么做,我要建个人网站数据降维方法 文章目录数据降维方法PCAPCA算法代码展示PCA **主成分分析(Principal Component Analysis,PCA)**是一种常用的数据降维方法。它通过线性变换将原始数据变换到一个新的坐标系中,使得第一个坐标(第一主成分…

数据降维方法

文章目录

  • 数据降维方法
    • PCA
      • PCA算法
      • 代码展示

PCA

**主成分分析(Principal Component Analysis,PCA)**是一种常用的数据降维方法。它通过线性变换将原始数据变换到一个新的坐标系中,使得第一个坐标(第一主成分)具有最大的方差,第二个坐标(第二主成分)具有次大的方差,以此类推。PCA的目的是从高维数据中提取出最重要的特征,通过保留最重要的主成分来实现数据的降维,同时尽可能保留原始数据的结构。

PCA算法

  1. 数据标准化

为了消除不同特征之间的量纲影响,通常需要对数据进行标准化处理,使得每个特征的均值为0,标准差为1。

标准化公式:
x′=x−μσ,x' = \frac{x - \mu}{\sigma},x=σxμ,
其中μ\muμ为特征均值,σ\sigmaσ为特征标准差。

  1. 计算协方差矩阵

协方差矩阵描述了数据特征之间的相关性。对于标准化后的数据,协方差矩阵可以通过计算特征之间的协方差得到。

协方差公式:
cov(X,Y)=1n−1∑i=1n(Xi−μX)(Yi−μY),cov(X,Y) = \frac{1}{n-1}\sum_{i=1}^{n}(X_i - \mu_X)(Y_i - \mu_Y),cov(X,Y)=n11i=1n(XiμX)(YiμY)
标准化后简化为特征向量的内积平均。

  1. 计算特征值和特征向量

求解协方差矩阵的特征值和对应的特征向量。特征值表示对应特征向量方向上的数据方差大小,特征向量给出了数据的主要分布方向(即主成分)。

  1. 选择主成分

根据特征值的大小,选择前kkk个最大的特征值对应的特征向量,这些特征向量构成了新的kkk维特征空间。特征值的累计贡献率(如前kkk个特征值之和占总特征值之和的比例)通常作为选择kkk的依据(如累计贡献率≥85%)。

  1. 变换数据

将原始数据投影到新的特征空间中,得到降维后的数据。投影过程通过原始数据矩阵与选定的特征向量矩阵相乘实现。

代码展示

import pandas as pd
from sklearn import datasets# 加载鸢尾花数据集
iris = datasets.load_iris()# 将数据集转换为DataFrame
iris_df = pd.DataFrame(data=iris.data,  # 特征数据columns=iris.feature_names  # 特征名称
)iris_df.info()iris.data_std = (iris.data - iris.data.mean(axis=0)) / iris.data.std(axis=0)from sklearn.decomposition import PCA# 设置PCA参数,这里我们选择保留90%的方差
pca = PCA(n_components=0.9)
iris.data_pca = pca.fit_transform(iris.data_std)# 可视化原始数据和降维后的数据
import matplotlib.pyplot as pltplt.figure(figsize=(12, 6))
plt.scatter(iris.data[:, 0], iris.data[:, 1], c=iris.target, edgecolor='k', alpha=0.7)
plt.xlabel('Sepal Length')
plt.ylabel('Sepal Width')
plt.title('Original Data')
plt.show()plt.figure(figsize=(12, 6));
plt.scatter(iris.data_pca[:, 0], iris.data_pca[:, 1], c=iris.target, edgecolor='k', alpha=0.7)
plt.xlabel('First Principal Component')
plt.ylabel('Second Principal Component')
plt.title('Data after PCA')
plt.show()

http://www.dtcms.com/wzjs/22464.html

相关文章:

  • ghostwin8网站奖别人做网站网络推广企业
  • 网站优化毕业设计爱站网关键词工具
  • tpshop开源商城敢用吗seo在中国
  • 民主与建设出版社网站网站自动收录
  • 英语营销型网站建设百度关键词批量看排名工具
  • 网站首页关键词设置网站建设推广服务
  • 做食品网站需要什么条件百度站长平台app
  • 喊别人做的网站不肯给代码电商平台排名
  • 在校学生兼职网站建设站长之家域名
  • 私人承接软件开发定制网站建设优化推广
  • word网站的链接怎么做东莞网络推广排名
  • 网页设计就是做网站优化的吗2345网址导航主页
  • 做网站排名收益凡科建站官网入口
  • 珠海网站建设策略如何营销
  • wordpress 招聘网站模板百度文库官网
  • 做外贸的阿里巴巴网站是哪个小说推广关键词怎么弄
  • 怎么能自己做网站锦绣大地seo官网
  • 做网站需要懂那些软件短视频平台推广
  • 淘宝网站建设的目的重庆seo网站排名
  • 四川建设网中标候选人公示武汉百度推广优化
  • 无锡便宜做网站广告网站推荐
  • 网站开发工程师证济南网站seo公司
  • 网站建设中翻译苏州seo网络推广
  • 电子商务网站建设下载电商推广联盟
  • 徐州智能模板建站如何创建网站的快捷方式
  • 个人简介ppt免费模板谷歌seo外包公司哪家好
  • ps手机网站页面设计网络营销到底是个啥
  • cms导入wordpress百度seo和sem的区别
  • 沈阳做网站的企业seo关键词优化培训班
  • 如何做jquery音乐网站定制网站建设推广服务