当前位置：首页 > news >正文

常见的降维算法

news 2025/7/2 7:47:44

作业：

自由作业：探索下什么时候用到降维？降维的主要应用？或者让ai给你出题，群里的同学互相学习下。可以考虑对比下在某些特定数据集上t-sne的可视化和pca可视化的区别。

一、什么时候用到降维？

降维通常用于以下几类情况：

1. 数据可视化

高维数据（>3维）无法直接可视化，常用降维将数据映射到2D或3D平面进行展示。
常用方法：PCA、t-SNE、UMAP。

2. 数据压缩 / 存储优化

高维数据存储代价大，降维后可减少冗余特征，节省存储空间。

3. 降噪（Denoising）

高维特征空间中可能存在大量噪声维度，降维有助于突出主要结构。

4. 加速模型训练 / 避免维数灾难

在监督学习或聚类中，太多维度容易导致过拟合或训练缓慢，降维可提升效率和模型泛化能力。

5. 特征冗余或共线性问题

特征间高度相关时，降维可消除多重共线性，提高建模稳定性。

二、降维的主要方法与应用场景

方法	类型	原理简介	适用场景
PCA	线性、无监督	主成分投影，保留最大方差方向	高维数据压缩、线性结构数据可视化
t-SNE	非线性、无监督	保持局部结构的概率分布相似性	聚类结构可视化、非线性流形数据展示
UMAP	非线性、无监督	通过图拓扑保持局部和整体结构	替代t-SNE，用于可视化/特征工程
LDA	线性、有监督	最大化类间方差与类内方差比	分类问题的有监督降维
Autoencoder	非线性、有监督	利用神经网络编码压缩再解码还原数据	图像降噪、生成模型、特征提取

三、t-SNE vs PCA：可视化对比分析

1. 适用数据集

以MNIST（手写数字图像，784维）或Iris数据集（4维）为例，我们可以观察两者的区别。

2. 可视化效果（以MNIST为例）

PCA 可视化：

优点：快速，线性变换，可解释性强。
缺点：只能保留全局最大方差方向，聚类不明显，容易“混团”。

t-SNE 可视化：

优点：保留局部结构，同类样本聚得更紧，异类分得更开。
缺点：
- 非线性变换，不能用于后续建模；
- 随机性大（不同run结果可能不同）；
- 参数敏感，尤其是perplexity。

可视化示意图

方法	可视化效果简述
PCA	线性投影，点分布均匀，类聚不明显
t-SNE	同类样本成簇，聚类轮廓清晰

PCA

t-SNE

四、实践建议：如何选用降维方法？

场景	建议方法	理由
数据预处理	PCA	快速提取主成分，增强模型泛化性
可视化非线性聚类结构	t-SNE / UMAP	更好展示局部结构，直观展示聚类效果
图像/文本压缩或编码	Autoencoder	可自适应学习低维特征表达
有标签分类建模前特征压缩	LDA	结合类别信息降维，提高类别区分能力

@浙大疏锦行

http://www.dtcms.com/a/182840.html

相关文章：

右值引用的剖析

OpenCv实战笔记（4）基于opencv实现ORB特征匹配检测

SpringCloud之Ribbon基础认识-服务负载均衡

MySQL索引与事务

游戏引擎学习第268天:合并调试链表与分组

windows 环境下 python环境安装与配置

KEIL_C51和KEIL_MDK共存

AI大模型学习十七、利用Dify搭建 AI 图片生成应用

average per-pixel disparity error: EPE及不同距离值下的误差曲线

Python函数式编程入门：闭包与装饰器详解

开疆智能Canopen转Profinet网关连接工博士GBS20机器人配置案例

栈应用：辅助站（c++）

使用 CST 软件增强工业设备的电磁兼容性设计：原理、方法和应用

SpringBoot框架开发网络安全科普系统开发实现

SAP CEO Christian Klein专访：企业AI、云转型与未来战略

MySQL进阶篇2_SQL优化、锁

JDBC工具类

基于Spring Boot + Vue的母婴商城系统（前后端分离）

PHP框架在分布式系统中的应用！

python04——条件判断（选择结构）

OLE（对象链接与嵌入）剪贴板内容插入到 CAD 图形中——CAD c# 二次开发

Kubernetes生产实战(十二)：无工具容器网络连接数暴增指南

Baklib加速企业AI数据准备实践

用AI写简历是否可行？

逆波兰表达式求值（中等）

第20章 Python数据类型详解：字典进阶

K8S Svc Port-forward 访问方式

计算机网络八股文--day1

[ctfshow web入门] web70

【计算机视觉】OpenCV实战项目：Athlete-Pose-Detection 运动员姿态检测系统：基于OpenCV的实时运动分析技术