【2025域适应科研日报】
本笔记主要为了记录自己的科研日报,前段时间刚开始想写的初衷也是为了自己的思考不跑偏,但是有几天又没有坚持下来,看到一位学长的文章,发现这种形式还是很有必要的,所以自己也打算坚持记录下来,由于还正在学习探索阶段,所以可能很多想法都不成熟,未来我也将会多多思考,一起监督,持续更新本文,欢迎一起交流学习呀~
2025.04.13
两种方案,一种是手动清洗,一种是利用中间域(提取不同域风格的共性)
思考:① 如何把不同的背景信息统一
2025.04.14
数据集背景已统一,后期将根据实验结果,从代码的模块进行改进,多看论文。
找找视觉语言模型,CLIP 相关的统一的论文对比 ,文本描述暂时可以不考虑,因为比较难,涉及到专业描述的知识,建议从其他图像特征方面进行考虑。
2025.04.16
仔细阅读VLP-UDA代码,直到可以老师指哪行,就知道意思和作用
替换背景的图片作为中间域
2025.04.23
初步确定自己的创新点
1.复杂场景到单一场景 真实域->中间域->实验室域
2.前景注意力机制
3.数据集
2025.04.24
真实域(网络上的图片)和中间域(将真实域网络上的图片背景统一的域)以及实验域
通过引入中间域的,可以避免直接从源域到目标域学习的挑战:
1.源域和目标域存在较大的域差异
2.模型需要一次性解决所有领域差异问题
3.缺乏中间过渡可能导致知识迁移不充分
引入中间域的优势:
1.渐进式适应:通过中间域作为桥梁,可以分阶段逐步适应不同领域间的差异,降低学习难度
2.减少领域差异:中间域可以缓解源域与目标域之间的分布差异,使知识迁移更加平滑
3.聚焦特定挑战:每个阶段可以针对特定的领域差异进行优化,而不是同时面对所有差异
4.提高可解释性:分阶段学习使知识转移过程更加透明,便于理解模型如何从源域概念过渡到目标域
2025.04.25
如何将源域 中间域 以及 目标域 分阶段学习起来?
阅读TTSDA-YOLO的论文,思考将他提出的两阶段训练方法作为我第一个创新点的实现方法
鉴于他没有开源代码,已发邮件但未果,但是方法巧妙,根据老师的建议,决定学习他的思想,自己实现相关的功能。
2025.04.26
分阶段训练,比如
第一阶段的 200个epoch训练真实域和中间域,用A模块
第二个阶段的100个epoch训练中间域,用B模块
测试阶段使用目标域
2025.05.01
尝试将论文里面的IDA和BRM模块用进我的任务里面,看看效果
再根据具体的效果修改方法
五一期间坚持更新中~沉淀思考ing