当前位置: 首页 > news >正文

碎片笔记|AI生成图像溯源方法源码复现经验(持续更新中……)

前言:本篇博客分享一些溯源方法的复现经验,希望能帮助到大家🎉。


目录

  • 1. Close-set Attribution
    • Repmix
    • De-Fake
    • DNA-Net
  • 2. Open-set Attribution
    • POSE
  • 3. Single-Model Attribution
    • OCC-CLIP
    • LatentTracer

1. Close-set Attribution

Repmix

论文信息:RepMix: Representation Mixing for Robust Attribution of Synthesized Images. ECCV, 2022.
开源代码:https://github.com/TuBui/image_attribution

环境配置

配置环境时,imagenet-c库不能使用pip install imagenet-c安装(会报错如下:

    x_start, y_start = np.random.randint(0, frost.shape[0] - 224), np.random.randint(0, frost.shape[1] - 224)
AttributeError: 'NoneType' object has no attribute 'shape'

根据相关经验,正确的安装方式为:打开链接

https://github.com/hendrycks/robustness/tree/master/ImageNet-C

将下述文件全部下载

在这里插入图片描述

然后在上述文件对应的目录下,运行pip install -e .命令进行安装。

代码适配

  • 如果要在其他数据集上运行该代码,只需要按给定格式生成相应的train/val/test.csv文件,再修改csv文件路径即可。

  • 原始的csv文件有三列,分别表示图像路径 / 图像模型类别 / 图像语义类别。如果不需要图像的语义类别,可以将对应值全部设置为0(而非直接删除该列),确保文件的正确读取。

  • 在运行test.py文件时,代码 utils/augment_imagenetc.py'clean': transforms.Compose([transforms.Resize(csize)] + norm) 一行要改为: 'clean': transforms.Compose([transforms.Resize([csize, csize])] + norm),不然会报错如下:

    RuntimeError: stack expects each tensor to be equal size, but got [3, 224, 298] at entry 0 and [3, 254, 224] at entry 1
    

    根据此篇博客,这是因为原始代码只会将图像较短边调整为 224,保持长宽比不变。而我们需要的是将图像尺寸变为224*224,故需对代码进行相应修改。

De-Fake

论文信息:DE-FAKE: Detection and Attribution of Fake Images Generated by Text-to-Image Generation Models. CCS, 2023.
开源代码: https://github.com/zeyangsha/De-Fake

环境配置

无过多要求

代码适配

  • 因为De-Fake用到了多模态特征,所以在适配其他数据集时,要事先使用blip模型生成每张图像对应的caption作为其prompt。然后,对数据加载方式进行修改,确保正确读取图像和相应文本。

  • De-Fake需要用到clip和blip预训练模型,可以预先下载下来,并更新以下路径:
    train.py中的model, preprocess = clip.load("ViT-B/32", device=device)
    test.py中的blip = blip_decoder(pretrained=blip_url, image_size=image_size, vit='base')
    第一个参数分别替换为相应文件的所在路径

    否则,可能会因为网络问题报错:

    Model has been downloaded but the SHA256 checksum does not not match. Please retry loading the model.
    

    “ViT-B/32” 对应预训练模型: https://openaipublic.azureedge.net/clip/models/40d365715913c9da98579312b702a82c18be219cc2a73407c4526f58eba950af/ViT-B-32.pt
    “blip” 对应预训练模型:
    https://storage.googleapis.com/sfr-vision-language-research/BLIP/models/model_base_capfilt_large.pth

DNA-Net

论文信息:Deepfake Network Architecture Attribution. AAAI 2022.
开源代码:https://github.com/ICTMCG/DNA-Det

环境配置

无过多要求

代码适配

如果要在其他数据集上运行该代码,只需要更新位于data/dataset.py下的ImageMultiCropDataset()类即可,确保数据能够正确读取。


2. Open-set Attribution

POSE

论文信息:Progressive Open Space Expansion for Open-Set Model Attribution. CVPR, 2023.
开源代码:https://github.com/ICTMCG/POSE

环境配置

代码适配

数据集

OSMA 数据集解压Tip:由于文件较大,推荐使用7z解压,Ubuntu首先使用apt-get install p7zip-full命令安装7z,然后cd切换到zip文件所在目录下,使用7z x name.zip完成解压(7z会自动解压分卷,无需事先手动合并)
尝试过unzip和7z解压方式,均以失败告终,最后选择在本地解压后再上传到服务器。


3. Single-Model Attribution

OCC-CLIP

论文信息:Which Model Generated This Image? A Model-Agnostic Approach for Origin Attribution. ECCV 2024.
开源代码:https://github.com/uwFengyuan/OCC-CLIP

环境配置

  • 代码实际运行时其实不需要environment.yaml中给出的数百个库,所以可以在执行conda create -n name python=3.11新建环境之后按需安装相应的库,节省安装时间和存储成本。

代码适配

⚠️注意:原代码并未使用全部数据进行训练、验证和测试,所以需修改dataloader.py中的data_label()函数,并更新dataset目录下用到的json文件。

数据集

这个工作还提出了一个新数据集,由4个真实图像集和9个生成模型图像集构成,共301688张图像,各类别图像数量如下表。
在这里插入图片描述
附:递归统计当前目录下全部文件数量命令:find ./ -type f | wc -l


LatentTracer

论文信息:How to Trace Latent Generative Model Generated Images without Artificial Watermark? ICML, 2024.
开源代码:https://github.com/ZhentingWang/LatentTracer

环境配置

代码适配


后记:后续将与大家分享关于如何设计实验,以实现在同一个数据集上横向比较上述三种不同类型溯源方法的一些个人见解。


参考链接

  • CLIP加载模型时因网络问题报错的一个解决方案 - 知乎

相关文章:

  • 设计模式-中介者模式
  • 研读论文《Attention Is All You Need》(4)
  • 【Oracle专栏】清理告警日志、监听日志
  • 如何创建自动工作流程拆分Google Drive中的PDF文件
  • 【kafka】kafka概念,使用技巧go示例
  • 【!!!!终极 Java 中间件实战课:从 0 到 1 构建亿级流量电商系统全链路解决方案!!!!保姆级教程---超细】
  • 试除法判断素数优化【C语言】
  • 解决docker alpine缺少字体的问题 Could not initialize class sun.awt.X11FontManager
  • 使用 Docker Desktop 安装 Neo4j 知识图谱
  • 面试--HTML
  • scikit-learn在无监督学习算法的应用
  • 网络协议分析 实验五 UDP-IPv6-DNS
  • Leetcode (力扣)做题记录 hot100(62,64,287,108)
  • Java 虚拟线程(Virtual Threads):原理、性能提升与实践
  • Vue 图片预览功能(含缩略图)
  • 5.14本日总结
  • 常见 RPC 协议类别对比
  • WEB安全--Java安全--CC1利用链
  • 如何迁移 WSL 卸载 Ubuntu WSL
  • 5.18-AI分析师
  • 费高云不再担任安徽省人民政府副省长
  • 兰州大学教授安成邦加盟复旦大学中国历史地理研究所
  • 睡觉总做梦是睡眠质量差?梦到这些事,才要小心
  • 对话郑永年:我们谈判也是为世界争公义
  • 国内首例侵入式脑机接口系统前瞻性临床试验:受试者已能用意念玩游戏
  • 年轻小将绽放光芒!中国短跑男女接力队直通东京世锦赛