当前位置：首页 > news >正文

基于 Java 和深度学习的图像分类应用实践

news 2025/8/23 13:05:35

前言

随着人工智能技术的飞速发展，深度学习在图像处理、自然语言处理等领域展现出强大的能力。然而，许多开发者认为深度学习只能依赖 Python 的框架（如 TensorFlow 或 PyTorch）。事实上，Java 生态也有成熟的深度学习库，如 Deeplearning4j（DL4J），适合企业级应用场景。本文将通过一个图像分类的案例，展示如何使用 Java 和 DL4J 实现深度学习模型的训练与推理，帮助 Java 开发者快速入门 AI 应用开发。

本文目标：

理解深度学习在图像分类中的应用。
掌握 DL4J 的基本使用。
提供一个可运行的 Java 代码示例。

欢迎关注我的 CSDN 博客，获取更多技术干货！

一、背景：为什么选择 Java 和深度学习？

1.1 图像分类的应用场景

图像分类是计算机视觉的核心任务之一，广泛应用于医疗影像诊断、自动驾驶物体识别、电商商品分类等领域。例如，电商平台需要根据用户上传的图片自动识别商品类别（如“衬衫”或“裤子”），这就离不开深度学习的支持。

1.2 Java 在企业中的优势

Java 以其跨平台性、稳定性及丰富的生态系统，在企业开发中占据重要地位。结合 DL4J，Java 开发者无需切换到 Python，就能直接在现有项目中集成 AI 功能，尤其适合微服务架构下的模型部署。

1.3 Deeplearning4j 简介

DL4J 是一个开源的深度学习框架，支持 JVM 环境。它提供与 TensorFlow 类似的功能（如卷积神经网络 CNN），并能无缝集成 Hadoop 和 Spark，适合大数据场景。

二、技术实现：基于 DL4J 的图像分类

2.1 案例目标

我们将实现一个简单的图像分类器，用于区分猫和狗的图片。数据集使用 Kaggle 的“Cats vs Dogs”数据集（假设已下载并解压至本地）。

数据集获取：本文使用 Kaggle 的“Cats vs Dogs”数据集（原竞赛链接：https://www.kaggle.com/c/dogs-vs-cats/data）。若无法直接下载，可尝试 Microsoft 官方来源（https://www.microsoft.com/en-us/download/details.aspx?id=54765）或 Hugging Face（https://huggingface.co/datasets/cats_vs_dogs）。

一张展示猫和狗样本图片的对比图，左侧为猫（标注“Cat”），右侧为狗（标注“Dog”），背景为灰色网格，突出数据集示例。

2.2 环境准备

JDK: 11 或以上
Maven: 用于依赖管理
DL4J: 核心库
数据集: Cats vs Dogs（约 25,000 张图片）

Maven 依赖配置：

<dependencies>
        <dependency>
            <groupId>ch.qos.logback</groupId>
            <artifactId>logback-classic</artifactId>
            <version>1.2.3</version>
        </dependency>

        <!-- DL4J 核心库 -->
        <dependency>
            <groupId>org.deeplearning4j</groupId>
            <artifactId>deeplearning4j-core</artifactId>
            <version>${dl4j.version}</version>
        </dependency>
        <!-- ND4J 本地支持，指定 macOS arm64 -->
        <dependency>
            <groupId>org.nd4j</groupId>
            <artifactId>nd4j-native</artifactId>
            <version>1.0.0-M2.1</version>
            <classifier>macosx-arm64</classifier>
        </dependency>
        <!-- DataVec 用于图像加载 -->
        <dependency>
            <groupId>org.datavec</groupId>
            <artifactId>datavec-api</artifactId>
            <version>${dl4j.version}</version>
        </dependency>
        <!-- Leptonica 平台支持 -->
        <dependency>
            <groupId>org.bytedeco</groupId>
            <artifactId>opencv-platform</artifactId>
            <version>4.5.5-1.5.7</version>
        </dependency>
        <!-- JavaCPP 核心库 -->
        <dependency>
            <groupId>org.bytedeco</groupId>
            <artifactId>javacpp</artifactId>
            <version>${javacpp.version}</version>
        </dependency>
    </dependencies>

2.3 数据预处理

DL4J 提供 DataVec 工具处理图像数据。我们需要将图片加载、缩放并转换为张量格式。

代码示例：

import org.datavec.image.loader.NativeImageLoader;
import org.nd4j.linalg.api.ndarray.INDArray;
import org.nd4j.linalg.dataset.api.preprocessor.ImagePreProcessingScaler;

import java.io.File;