当前位置：首页 > news >正文

【深度学习-pytorch篇】1. Pytorch矩阵操作与DataSet创建

news 来源：原创 2025/5/30 10:48:43

Pytorch矩阵操作与DataSet创建

1. Python 环境配置

1.1 安装 Anaconda

推荐使用 Anaconda 来管理 Python 环境，访问官网下载安装：

https://www.anaconda.com/download/success

1.2 安装 PyTorch

请根据自己的系统平台（Windows/Linux/macOS）和 CUDA 版本访问以下链接获取安装命令：

https://pytorch.org/get-started/locally/

检查 CUDA 工具链是否安装成功：

!nvcc --version

测试 GPU 加速是否可用：

import torch
print(torch.cuda.is_available())  # True 表示当前设备支持 GPU 运算

2. 矩阵操作复习

2.1 创建随机整数矩阵

import torch
import numpy as np# 使用 PyTorch 生成 5x5 的随机整数矩阵，取值范围在 [0, 5)
# torch.randint(lower_bound, upper_bound, size)
A = torch.randint(0, 5, (5, 5))
print("Torch 矩阵 A:\n", A)# 使用 NumPy 生成相同尺寸的随机整数矩阵
# np.random.randint(lower_bound, upper_bound, size)
A_np = np.random.randint(0, 5, (5, 5))
print("NumPy 矩阵 A_np:\n", A_np)# 访问第 4 行第 3 列元素（从0开始）
print("A[3][2] =", A[3][2])

2.2 基本矩阵运算

# 构造两个 5x6 的整数矩阵
A = torch.randint(0, 5, (5, 6))
B = torch.randint(0, 5, (5, 6))A_np = np.random.randint(0, 5, (5, 6))
B_np = np.random.randint(0, 5, (5, 6))

加法：C = A + B

C = A + B  # 按元素相加
print("Torch 加法:\n", C)C_np = A_np + B_np
print("NumPy 加法:\n", C_np)

减法：C = A - B

C = A - B  # 按元素相减
print("Torch 减法:\n", C)C_np = A_np - B_np
print("NumPy 减法:\n", C_np)

元素级乘法（Hadamard积）

C = A * B  # 对应元素相乘
print("Torch 元素级乘法:\n", C)C_np = A_np * B_np
print("NumPy 元素级乘法:\n", C_np)

矩阵乘法（内积）

# 对 B 进行转置后乘法，得到结果为 [5, 5]
C = torch.matmul(A, B.T)
print("Torch 矩阵乘法 matmul:\n", C)C = A @ B.T  # 简写形式
print("Torch 矩阵乘法 @:\n", C)C = A.mm(B.T)  # 旧API
print("Torch 矩阵乘法 mm:\n", C)C_np = np.matmul(A_np, B_np.T)
print("NumPy 矩阵乘法:\n", C_np)

3. 生成二维高斯分布数据集

import matplotlib.pyplot as plttorch.manual_seed(42)  # 设置随机种子以确保结果一致num_samples = 500  # 每类样本数量
dim = 2  # 每个样本的维度# 类别 0：中心在 (-2, -2)，协方差为单位阵
mean_0 = torch.tensor([-2.0, -2.0])
cov_0 = torch.eye(dim)# 类别 1：中心在 (2, 2)，协方差为单位阵
mean_1 = torch.tensor([2.0, 2.0])
cov_1 = torch.eye(dim)# 从多元高斯分布中采样
class_0 = torch.distributions.MultivariateNormal(mean_0, cov_0).sample((num_samples,))
class_1 = torch.distributions.MultivariateNormal(mean_1, cov_1).sample((num_samples,))# 创建标签
labels_0 = torch.zeros(num_samples, dtype=torch.long)
labels_1 = torch.ones(num_samples, dtype=torch.long)# 合并数据与标签
X = torch.cat([class_0, class_1], dim=0)
y = torch.cat([labels_0, labels_1], dim=0)# 打乱样本顺序
indices = torch.randperm(X.size(0))
X, y = X[indices], y[indices]# 可视化
plt.figure(figsize=(6, 6))
plt.scatter(X[:, 0], X[:, 1], c=y, cmap="coolwarm", edgecolors="k", alpha=0.7)
plt.xlabel("Feature 1")
plt.ylabel("Feature 2")
plt.title("二维高斯分布数据集")
plt.show()

torch.eye用法

import torchI = torch.eye(3)
print(I)

tensor([[1., 0., 0.],[0., 1., 0.],[0., 0., 1.]])

4. 自定义 Dataset 类

from torch.utils.data import Datasetclass GaussianDataset(Dataset):def __init__(self, X, y):"""初始化数据集参数：- X (Tensor): 特征数据，形状为 [样本数, 特征维度]- y (Tensor): 标签数据，形状为 [样本数]"""self.X = Xself.y = ydef __len__(self):"""返回数据集总长度"""return len(self.X)def __getitem__(self, index):"""获取第 index 个样本参数：- index (int): 样本索引返回：- tuple: (样本特征, 样本标签)"""return self.X[index], self.y[index]

5. 使用 DataLoader 批次读取数据

from torch.utils.data import DataLoader# 实例化数据集
dataset = GaussianDataset(X, y)# 创建 Dataloader：按 batch_size 划分，每轮训练前打乱顺序
dataloader = DataLoader(dataset, batch_size=32, shuffle=True)

6. 查看与可视化数据批次

6.1 打印一个批次的数据

for batch_idx, batch in enumerate(dataloader):data, label = batchprint("Batch 索引:", batch_idx)print("数据形状:", data.shape)print("标签形状:", label.shape)print("第一个样本:", data[0])print("对应标签:", label[0])break  # 只看一个批次

6.2 可视化多个批次

for batch_idx, batch in enumerate(dataloader):data, label = batchplt.figure(figsize=(6, 6))plt.scatter(data[:, 0], data[:, 1], c=label, cmap="coolwarm", edgecolors="k", alpha=0.7)plt.xlabel("Feature 1")plt.ylabel("Feature 2")plt.title(f"第 {batch_idx+1} 个批次")plt.show()if batch_idx == 2:  # 展示前 3 个批次即可break

7. 总结函数功能与参数

7.1 `torch.randint`

功能：生成随机整数张量
参数：
- low：最小值（含）
- high：最大值（不含）
- size：输出张量形状

7.2 `torch.distributions.MultivariateNormal`

功能：定义多元正态分布并采样
参数：
- mean：均值向量
- covariance_matrix：协方差矩阵
方法：
- .sample((n,))：采样 n 个样本

7.3 `DataLoader`

功能：按批次加载数据，支持打乱与多线程
参数：
- dataset：继承自 Dataset 的对象
- batch_size：每个批次的样本数量
- shuffle：是否打乱数据顺序

7.4 `plt.scatter`

功能：绘制二维散点图
参数：
- x, y：二维数据坐标
- c：颜色标签
- cmap：颜色映射
- edgecolors：边框颜色
- alpha：透明度

8. 矩阵乘法、Hadamard 积、点乘算法解释

8.1 点乘（Dot Product）

定义：
点乘是两个向量之间的操作，将两个一维向量压缩成一个标量（数值）。

设有两个长度为 $n$ 的向量：
$\mathbf{a} = [a_1, a_2, \dots, a_n], \quad \mathbf{b} = [b_1, b_2, \dots, b_n]$

它们的点积（dot product）定义为：
$\mathbf{a} \cdot \mathbf{b} = \sum_{i=1}^{n} a_i \cdot b_i$

举例：

import torcha = torch.tensor([1.0, 2.0, 3.0])
b = torch.tensor([4.0, 5.0, 6.0])dot = torch.dot(a, b)
print(dot)  # 输出：32.0 = 1×4 + 2×5 + 3×6

8.2 矩阵乘法（Matrix Multiplication）

定义：
矩阵乘法是两个二维矩阵之间的乘积，满足以下维度条件：

若 $\in \mathbb{R}^{m \times n}$ ， $\in \mathbb{R}^{n \times k}$ ，
则它们的乘积为 $\in \mathbb{R}^{m \times k}$ ，其计算方式为：

$C_{i,j} = \sum_{l=1}^{n} A_{i,l} \cdot B_{l,j}$

即：第 $i$ 行 × 第 $j$ 列。

算法解释：

# 手动实现矩阵乘法（简化版本）
import torchA = torch.tensor([[1., 2.],[3., 4.]])  # 2x2B = torch.tensor([[5., 6.],[7., 8.]])  # 2x2# 目标结果矩阵
C = torch.zeros(2, 2)for i in range(2):         # 遍历 A 的行for j in range(2):     # 遍历 B 的列for k in range(2): # 对应维度求和C[i][j] += A[i][k] * B[k][j]print(C)
# 输出：
# tensor([[19., 22.], 19=5+14 22 = 6+16
#         [43., 50.]]) 43 = 15+28  50= 18+32

等效 PyTorch 写法：

C = torch.matmul(A, B)

8.3 区别总结

对比项	点乘（dot）	矩阵乘法（matmul）
操作对象	一维向量 $\mathbf{a}, \mathbf{b}$	二维矩阵 $A, B$
输出	标量（单个数字）	矩阵（新的二维张量）
函数	`torch.dot(a, b)`	`torch.matmul(A, B)` or `A @ B`
应用场景	计算相似度、投影、内积	神经网络权重变换、特征转换、线性层

# 举例说明区别
a = torch.tensor([1., 2., 3.])
b = torch.tensor([4., 5., 6.])
print("点乘结果：", torch.dot(a, b))  # 输出：32.0A = torch.tensor([[1., 2.], [3., 4.]])
B = torch.tensor([[5., 6.], [7., 8.]])
print("矩阵乘法结果：\n", torch.matmul(A, B))

8.4. Hadamard 积

若有两个相同形状的矩阵：

$\begin{bmatrix} a_{11} & a_{12} \\\\ a_{21} & a_{22} \end{bmatrix}, \quad B = \begin{bmatrix} b_{11} & b_{12} \\\\ b_{21} & b_{22} \end{bmatrix}$

它们的 Hadamard 积 定义为：

$\odot B = \begin{bmatrix} a_{11} \cdot b_{11} & a_{12} \cdot b_{12} \\\\ a_{21} \cdot b_{21} & a_{22} \cdot b_{22} \end{bmatrix}$

其中 $\odot$ 表示逐元素相乘，即对应位置元素分别相乘，不进行矩阵乘法的求和操作。

import torch
A = torch.tensor([[1., 2.], [3., 4.]])
B = torch.tensor([[10., 20.], [30., 40.]])C = A * B  # Hadamard 积
print(C)

tensor([[10., 40.],[90., 160.]])

Python后端开发实战：从0到1搭建高可用API服务

Linux命令行命令自动补全

vs中添加三方库的流程

webpack打包基本配置

GUI 编程——python

干货｜VR全景是什么？

同源“平滑思想”的问题解法：正则化与拉普拉斯平滑

hi3516cv610分配多个 vb pool及查看vb信息

Linux的SHELL脚本基础

在qt中使用c++实现与Twincat3 PLC变量通信

Kubernetes Dashboard 安装部署、访问与管理实战实验

VScode单双引号、分号格式

【深度学习-pytorch篇】4. 正则化方法（Regularization Techniques）

ParakeetTDT0.6BV2,语音识别ASR,极速转录, 高精度英文转录,标点支持(附整合包)

常用算法模板函数（Python）

用Python玩转人工智能——手搓图像分类模型

【PhysUnits】13 改进减法(sub.rs)

【加密算法】

从“被动养老”到“主动健康管理”：平台如何重构代际关系？

Odoo 条码功能全面深度解析（VIP15万字版）

上海宝山网站建设培训/防城港网站seo

怎么做招聘有哪些网站/网站排名优化软件联系方式

常规网站建设价格实惠/搜狗指数

唐山市做网站/seo搜索引擎优化怎么优化

网站代理什么意思/网络优化公司排名

室内设计网站排行榜前十名知乎/排名优化公司