乳腺癌良性和恶性图像分类数据集
本数据集包含两类乳腺肿瘤影像样本:乳腺良性肿瘤和乳腺恶性肿瘤。旨在构建高精度的图像分类模型,实现对乳腺肿瘤类型的自动识别与判定。通过对大量标注清晰的乳腺肿瘤影像进行深度学习训练,模型能够自动提取乳腺组织的关键特征,区分良性与恶性肿瘤,从而为临床提供辅助诊断依据。该数据集的建立旨在推动深度学习与人工智能技术在乳腺癌早期筛查与智能诊断中的应用,助力实现乳腺医疗影像分析的标准化与智能化。
数据集概览
数据图像:

图1 样本图像
数据类型:

表1 数据类型与格式
数据规模:
(1)数据集划分饼图

图2 数据集划分饼图
数据集类别

表3 类别定义
数据集来源

表4 数据集来源与说明
数据集用途
本数据集用于乳腺良性与恶性肿瘤影像的分类模型训练与验证,包含两类样本:乳腺良性肿瘤(Benign)和乳腺恶性肿瘤(Malignant)。可应用于以下研究与开发方向:
(1)模型训练:支持基于深度学习的图像分类模型(如ResNet50、VGG16、Swin Transformer)进行乳腺肿瘤影像特征学习。
(2)性能评估:用于测试模型在乳腺良性和恶性肿瘤分类任务中的准确率、召回率、F1值等性能指标。
(3)特征分析:研究不同乳腺肿瘤影像在纹理、形态及组织结构等方面的特征差异。
(4)系统开发:为乳腺肿瘤智能诊断系统、医学影像辅助诊断平台及健康筛查系统提供数据支持。
数据集须知
(1)数据来源:基于公开的乳腺肿瘤影像数据集,仅限科研与教学用途。
(2)数据结构:包含训练集与测试集,分为两类样本(乳腺良性肿瘤、乳腺恶性肿瘤)。
(3)文件格式:图像文件为.jpg格式,文件命名与类别严格对应。
(4)使用要求:需遵守乳腺医学影像数据隐私与伦理保护相关规定,引用时须注明数据来源。
(5)适用范围:适用于乳腺肿瘤影像识别、分类、特征提取及智能诊断系统研究。
数据集性能
训练与验证准确率和损失曲线:

图3 训练与验证准确率和损失曲线线
这张图展示了基于Swin Transformer模型在训练过程中,训练和验证的准确率及损失随训练轮次(epoch)变化的情况。从训练与验证准确率图中可以看出,训练准确率和验证准确率在初期有较大波动,但随着训练的进行,准确率逐步上升并接近1.00,说明模型在训练集和验证集上的性能逐渐提高。然而,验证准确率波动较大,可能存在过拟合的风险。下方的训练与验证损失图显示,训练损失快速下降并趋于稳定,表明模型在训练集上的表现不断优化;而验证损失波动较大,尤其在训练后期,可能是由于模型在验证集上出现过拟合,导致损失不稳定。综上,尽管训练集表现良好,但验证集的波动表明过拟合问题需要关注,可能需要通过调整正则化策略、增加数据集多样性或使用早停技术等手段来改善模型的泛化能力。
混淆矩阵热力图:

图4 混淆矩阵热力图
这张混淆矩阵热图展示了基于Swin Transformer模型在乳腺肿瘤分类任务中的表现。图中的左上角显示了模型对良性肿瘤的预测准确率为99%,而右上角的误判率仅为1%,即模型几乎没有错误地将良性肿瘤预测为恶性。左下角的值为0,表明没有发生将实际良性肿瘤误预测为恶性的情况。右下角的值为1.0,显示出模型在预测恶性肿瘤时的完美准确性。这些结果表明,Swin Transformer模型在乳腺肿瘤的分类中表现出色,具有较高的准确性和较低的误分类率,能够有效地帮助实现精准的肿瘤分类。
各类认知障碍的分类性能评估:准确率、精确率、召回率与F1分数图

图5 各类认知障碍的分类性能评估:准确率、精确率、召回率与F1分数图
这张图展示了基于Swin Transformer模型在乳腺肿瘤分类任务中的评估结果,涵盖了准确率、精确度、召回率和F1分数四个重要指标。整体准确率为0.99,表明模型在所有分类任务中的表现非常优秀。精确度和召回率方面,良性肿瘤的精确度为0.99,召回率为0.99,恶性肿瘤的精确度和召回率分别为0.99和1.00,显示出模型对两类肿瘤的高效区分能力。F1分数分别为0.99和1.00,反映了模型在精确度和召回率之间的良好平衡。总体而言,模型在乳腺肿瘤分类中的表现非常出色,具有较高的准确性和可靠性,为乳腺肿瘤的早期诊断提供了有力的支持。
