肺组织图像分类与肺癌图像分类数据集
本数据集包含肺腺癌、良性肺组织与肺鳞状细胞癌图像,通过深度学习训练,模型自动提取特征并输出分类标签与置信度,为临床提供辅助诊断,推动肺癌智能诊断与早期筛查。
数据集概览
数据图像:

图1 样本图像
数据类型:

表1 数据类型与格式
数据规模:
(1)数据集划分饼图

图2 数据集划分饼图
数据集类别

表3 类别定义
数据集来源

表4 数据集来源与说明
数据集用途
本数据集用于肺腺癌、良性肺组织与肺鳞状细胞癌图像的分类模型训练与验证,包含三类样本:肺腺癌(Lung Adenocarcinoma)、良性肺组织(Benign Lung Tissue)和肺鳞状细胞癌(Lung Squamous Cell Carcinoma)。可应用于以下研究与开发方向:
(1)模型训练:支持基于深度学习的图像分类模型(如ResNet50、VGG16、Swin Transformer)进行肺腺癌、良性肺组织与肺鳞状细胞癌图像特征学习。
(2)性能评估:用于测试模型在肺腺癌、良性肺组织与肺鳞状细胞癌分类任务中的准确率、召回率、F1值等指标。
(3)特征分析:研究肺腺癌、良性肺组织与肺鳞状细胞癌在结构、纹理与细胞形态等方面的差异。
(4)系统开发:为肺癌智能诊断系统、医学影像辅助诊断平台及筛查系统提供数据支持。
数据集须知
(1)数据来源:基于公开的肺腺癌、良性肺组织与肺鳞状细胞癌图像数据集,仅限科研与教学用途。
(2)数据结构:包含训练集与测试集,分为三类样本(肺腺癌、良性肺组织、肺鳞状细胞癌)。
(3)文件格式:图像文件为.jpg格式(按类别文件夹组织),文件命名与类别标签严格对应。
(4)使用要求:需遵守医学影像数据隐私与伦理保护相关规定,引用时须注明数据来源。
(5)适用范围:适用于肺腺癌、良性肺组织与肺鳞状细胞癌的图像识别、分类、特征提取及智能诊断系统研
数据集性能
训练与验证准确率和损失曲线:

图3 训练与验证准确率和损失曲线线
训练与验证曲线显示,模型准确率快速接近 100%,并在训练过程中收敛迅速,验证集表现与训练集相似,未出现过拟合,具有良好的泛化能力。训练损失快速下降并保持低水平,验证损失约为 0.01 以下,表明模型在未知数据上也表现优秀。
混淆矩阵热力图:

图4 混淆矩阵热力图
混淆矩阵图显示,模型在所有类别上的预测均为 1.0,对角线元素无误,表明每个类别的预测完全准确。肺腺癌、良性肺组织和肺鳞状细胞癌的样本都被正确分类,进一步证明了模型的高精度和鲁棒性,几乎没有分类错误。
各类的分类性能评估:准确率、精确率、召回率与F1分数图

图5 各类的分类性能评估:准确率、精确率、召回率与F1分数图
分类性能指标图显示,模型在每个类别上的表现非常优秀,整体准确率达到100%。各类别的精确率、召回率和F1-score均为1.00,表明模型对肺腺癌、良性肺组织和肺鳞状细胞癌的预测完全准确,没有假阳性或假阴性,能够有效地区分各类病理图像。
