当前位置：首页 > news >正文

JAVA学习-练习试用Java实现“TensorFlow/Deeplearning4j：利用DL4J构建卷积神经网络进行图像分类”

news 2025/10/11 5:29:28

问题：

java语言编辑，TensorFlow/Deeplearning4j：利用DL4J构建卷积神经网络进行图像分类。

解答思路：

以下是使用Deeplearning4j构建卷积神经网络（CNN）进行图像分类的Java代码示例。在这个例子中，我们将使用MNIST数据集，这是一个常用的手写数字数据集。

首先，需要确保你的项目中包含了Deeplearning4j的依赖。下面是一个简单的Maven依赖配置示例：

<dependencies><!-- Deeplearning4j core dependency --><dependency><groupId>org.deeplearning4j</groupId><artifactId>deeplearning4j-core</artifactId><version>1.0.0-M5.1</version></dependency><!-- DL4J CNN module --><dependency><groupId>org.deeplearning4j</groupId><artifactId>deeplearning4j-nn</artifactId><version>1.0.0-M5.1</version></dependency><!-- DL4J Data module --><dependency><groupId>org.deeplearning4j</groupId><artifactId>deeplearning4j-data</artifactId><version>1.0.0-M5.1</version></dependency><!-- DL4JNNI module (for GPU support, if available) --><dependency><groupId>org.deeplearning4j</groupId><artifactId>deeplearning4j-nnn</artifactId><version>1.0.0-M5.1</version></dependency></dependencies>

现在，以下是使用Deeplearning4j构建CNN进行图像分类的Java代码：

import org.deeplearning4j.datasets.iterator.impl.MNISTDataSetIterator;import org.deeplearning4j.nn.conf.inputs.InputType;import org.deeplearning4j.nn.conf.layers.*;import org.deeplearning4j.nn.multilayer.MultiLayerNetwork;import org.deeplearning4j.nn.weights.WeightInit;import org.deeplearning4j.optimize.listeners.ScoreIterationListener;import org.nd4j.linalg.activations.Activation;import org.nd4j.linalg.learning.config.Adam;import org.nd4j.linalg.lossfunctions.LossFunctions;public class ConvolutionalNeuralNetworkExample {public static void main(String[] args) throws Exception {// 设置输入层参数int nEpochs = 15;int batchSize = 64;int outputNum = 10; // MNIST数据集有10个类别// 加载MNIST数据集MNISTDataSetIterator mnistTrain = new MNISTDataSetIterator(batchSize, true, 12345);MNISTDataSetIterator mnistTest = new MNISTDataSetIterator(batchSize, false, 12345);// 定义网络结构int height = 28;int width = 28;int channels = 1; // MNIST是灰度图像，通道数为1MultiLayerNetwork model = new MultiLayerNetwork.Builder().seed(12345).weightInit(WeightInit.XAVIER).updater(new Adam(0.001)).list().layer(0, new ConvolutionLayer.Builder(5, 5).nIn(channels).stride(1, 1).nOut(20).activation(Activation.RELU).build()).layer(1, new SubsamplingLayer.Builder(PoolingType.MAX).kernelSize(2, 2).stride(2, 2).build()).layer(2, new ConvolutionLayer.Builder(5, 5).stride(1, 1).nOut(50).activation(Activation.RELU).build()).layer(3, new SubsamplingLayer.Builder(PoolingType.MAX).kernelSize(2, 2).stride(2, 2).build()).layer(4, new DenseLayer.Builder().activation(Activation.RELU).nOut(500).build()).layer(5, new OutputLayer.Builder(LossFunctions.LossFunction.NEGATIVELOGLIKELIHOOD).activation(Activation.SOFTMAX).nOut(outputNum).build()).setInputType(InputType.convolutionalFlat(height, width, channels)).build();// 编译模型model.init();model.setListeners(new ScoreIterationListener(1));// 训练模型for (int i = 0; i < nEpochs; i++) {System.out.println("Epoch " + i);model.fit(mnistTrain);}// 测试模型System.out.println("Evaluate model...");org.nd4j.evaluation.Evaluation eval = model.evaluate(mnistTest);System.out.println(eval.stats());}}

需要注意以下几点：

1. 代码使用了MNIST数据集，该数据集通过'MNISTDataSetIterator'加载。

2. 定义了一个简单的CNN，包含卷积层、池化层、全连接层和输出层。

3. 使用Adam优化器和交叉熵损失函数来编译模型。

4. 模型在训练数据上训练了指定数量的epochs，并在测试数据上进行了评估。

5. 运行此代码前，确保已经正确配置了Deeplearning4j的依赖和模型文件。

需要注意，上述代码使用了Deeplearning4j的较旧版本（1.0.0-M5.1）。最新版本的Deeplearning4j可能会有一些API的变化，所以需要根据使用的Deeplearning4j版本进行相应的调整。

(文章为作者在学习java过程中的一些个人体会总结和借鉴，如有不当、错误的地方，请各位大佬批评指正，定当努力改正，如有侵权请联系作者删帖。)

查看全文

http://www.dtcms.com/a/257702.html