当前位置: 首页 > news >正文

tensorflow image_dataset_from_directory 训练数据集构建

以数据集 https://www.kaggle.com/datasets/vipoooool/new-plant-diseases-dataset 为例

目录结构

训练图像数据集要求:

  • 主目录下包含多个子目录,每个子目录代表一个类别。
  • 每个子目录中存储属于该类别的图像文件。

例如

main_directory/
...cat/
......cat_image_1.jpg
......cat_image_2.jpg
...dog/
......dog_image_1.jpg
......dog_image_2.jpg
  • main_directory 是主目录。
  • cat 和 dog 是两个类别对应的子目录。
  • 子目录中的文件是属于该类别的图像文件。

在 TensorFlow 和 Keras 中,image_dataset_from_directory 是一个用于从文件系统中加载图像数据的便捷函数。它可以从目录结构中自动推断标签,并生成一个 tf.data.Dataset 对象,便于模型训练和评估。

download_path = kagglehub.dataset_download("vipoooool/new-plant-diseases-dataset")
print("Path to dataset files:", download_path)# 定义数据集路径
dataset_path = f"{download_path}/New Plant Diseases Dataset(Augmented)/New Plant Diseases Dataset(Augmented)"
# 定义训练集目录
trainDir = os.path.join(dataset_path, "train")# 开启 TensorFlow 设备放置日志,方便调试时查看运算在哪个设备上执行
# tf.debugging.set_log_device_placement(True)print("trainDir:", trainDir)
# 从训练集目录加载图像数据集
training_set = keras_utils.image_dataset_from_directory(trainDir,labels="inferred",  # 从目录结构推断图像标签label_mode="categorical",  # 使用独热编码的标签class_names=None,  # 自动推断类别名称color_mode="rgb",  # 处理 RGB 图像batch_size=32,  # 每个批次包含 32 张图像image_size=(128, 128),  # 将图像大小调整为 128x128shuffle=True,  # 打乱数据集seed=None,  # 不设置随机种子validation_split=None,  # 不进行数据集划分subset=None,  # 不指定子集interpolation="bilinear",  # 使用双线性插值调整图像大小follow_links=False,  # 不跟随符号链接crop_to_aspect_ratio=False,  # 不按纵横比裁剪图像
)

相关文章:

  • 力扣刷题Day 70:在排序数组中查找元素的第一个和最后一个位置(34)
  • python3GUI--车牌、车牌颜色识别可视化系统 By:PyQt5(详细介绍)
  • 【更新至2024年】1991-2024年上市公司信息披露质量KV指数数据(含原始数据+计算过程+结果)
  • Vue跨层级通信
  • c++中char *p指针指向字符串输出问题
  • 2D 写实交互数字人:多终端实时交互,引领数字化浪潮
  • 软件工程:如何在项目中把软件做好
  • 数学复习笔记 25
  • 神经符号AI的企业应用:结合符号推理与深度学习的混合智能
  • 虚拟机CentOS 7 网络连接显示“以太网(ens33,被拔出)“、有线已拔出、CentOS7不显示网络图标
  • Redis中的setIfAbsent方法和execute
  • Mybatis入门到精通
  • SQL 中 JOIN 的执行顺序优化指南
  • GAN模式崩塌难题:成因分析与多维度解决方案
  • nlohmann/json简介及使用
  • 半导体热电技术方案领跑者「富信」×企企通,构建采购数字化升级
  • Cursor 工具项目构建指南:Java 21 环境下的 Spring Boot Prompt Rules 约束
  • psycopg2-binary、pgvector、 SQLAlchemy、 PostgreSQL四者的关系
  • .NET 原生驾驭 AI 新基建实战系列(三):Chroma ── 轻松构建智能应用的向量数据库
  • vue源码解析——diff算法
  • 顺德网站建设7starry/成品网站货源1
  • 域名停靠网站下载大全免费/推广软文平台
  • 苏州相城做网站哪家好/营销方案ppt
  • 陕西网站建设报价/长春网站建设团队
  • 合肥网站建设第一品牌/网站运营培训学校
  • 如何在百度里做推广网站/网站收录教程