11.03
1. 数据集介绍 (DSB2018)
数据内容: DSB2018是一个开源的医学图像数据集,专门用于细胞分割任务,包含670张显微镜下拍摄的照片,并辅以相应的标注文件。
数据构成: 该数据集采用“一张图,一幅标签”的模式。图像作为输入特征,而标签作为分割结果,是一个与图像尺寸相同的二值矩阵(黑/白,即0/1),用于指示每个像素点属于细胞还是背景。
2. 数据预处理流程
应用工具: 讲解了利用OpenCV和PyTorch中的transforms模块进行数据处理的技术方案。
数据增广 
在训练集中应用了系列操作以增加数据多样性,包括:水平翻转、垂直翻转、色调和饱和度调整、随机亮度甚至对比度调整。
在验证集上则省略了部分激进的增强方法,主要目的是保持数据一致性以评估模型性能。
数据转换与标准化:
通道转换: OpenCV加载图像为BGR格式,需转换为模型使用的RGB格式。
像素值归一化: 将像素值从0-255区间缩放到0-1区间,以进行标准化处理,便于神经网络的训练。
3. 模型训练核心环节
超参数配置: 介绍了将所有超参数(如学习率、批量大小等)封装在一个独立的函数内部进行管理的方式。此设计使得后续调整和调试更加方便,增强了代码的可维护性和复用性。
模型架构: 展示了一个基于VGG的轻量化网络模型,其结构包含多个卷积层和上采样层,旨在返回与输入图像相同分辨率的分割结果。
训练与验证:
使用日志记录器来监控训练过程的关键指标,如迭代次数、损失函数值和IOU(交并比)值。
训练好的模型会保存为.pth或.pt格式的文件,以便后续使用和评估。
