当前位置: 首页 > news >正文

深度学习PyTorch之数据加载DataLoader

深度学习pytorch之简单方法自定义9类卷积即插即用

文章目录

  • 数据加载基础架构
    • 1、Dataset类详解
    • 2、DataLoader核心参数解析
    • 3、数据增强

数据加载基础架构

核心类关系图

torch.utils.data
├── Dataset (抽象基类)
├── DataLoader (数据加载器)
├── Sampler (采样策略)
├── BatchSampler (批量采样)
└── IterableDataset (流式数据集)

1、Dataset类详解

自定义数据集模板

from torch.utils.data import Dataset

class CustomDataset(Dataset):
    def __init__(self, data_dir, transform=None):
        self.file_list = glob.glob(f"{data_dir}/*.jpg")
        self.labels = self._load_labels()
        self.transform = transform

    def __len__(self):
        return len(self.file_list)

    def __getitem__(self, idx):
        image = Image.open(self.file_list[idx])
        label = self.labels[idx]
        
        if self.transform:
            image = self.transform(image)
            
        return image, label

    def _load_labels(self):
        # 实现标签加载逻辑
        return [...]

关键方法说明:

  • init: 初始化数据路径、预处理方法等

  • len: 返回数据集样本总数

  • getitem: 根据索引返回单个样本数据

2、DataLoader核心参数解析

基础配置示例

from torch.utils.data import DataLoader

dataloader = DataLoader(
    dataset=dataset,
    batch_size=64,
    shuffle=True,
    num_workers=4,
    pin_memory=True,
    drop_last=False
)

参数详解表

参数类型默认值作用
batch_sizeint1批量大小
shuffleboolFalse是否打乱数据顺序
samplerSamplerNone自定义采样策略
batch_samplerSamplerNone批量采样策略
num_workersint0数据加载子进程数
collate_fncallabledefault_collate批量样本处理函数
pin_memoryboolFalse是否锁页内存加速传输
drop_lastboolFalse是否丢弃最后不完整批次

3、数据增强

深度学习 PyTorch 中 18 种数据增强策略与实现

相关文章:

  • KafkaRocketMQ
  • AI智能导航站HTML5自适应源码帝国cms7.5模板
  • word甲烷一键下标
  • 08 HarmonyOS NEXT 仿uv-ui Tag组件开发教程系列(二)
  • 【Java学习】包装类
  • 【商城实战(20)】商品管理功能深化实战
  • 【理想解法学习笔记】
  • 计算机操作系统
  • docker企业级事例部署phpmyadmin和MySQL
  • win10电脑鼠标速度突然变的很慢?
  • 【Go语言圣经1.1】
  • Linux 常用测试网络带宽命令
  • 八股打卡(七)
  • 密码学 网络安全 科普 网络安全密码技术
  • 【vllm】Qwen2.5-VL-72B-AWQ 部署记录
  • Webshell原理与利用
  • 天津大学:《深度解读DeepSeek:部署、使用、安全》
  • 仅仅使用pytorch来手撕transformer架构(2):多头注意力MultiHeadAttention类的实现和向前传播
  • 侯捷 C++ 课程学习笔记:C++内存管理机制
  • Qt 初识
  • 开启征集!社会主义核心价值观公益广告征集展示活动启幕
  • 总数再更新!我国新增三项全球重要农业文化遗产
  • 广西隆林发生一起山洪灾害,致4人遇难
  • 山西持续高温:阳城地表温度72.9℃破纪录,明日局部地区仍将超40℃
  • 让中小学生体验不同职业,上海中高职院校提供超5万个体验名额
  • 总书记回信二周年之际,上海如何将垃圾分类深度融入城市发展?