当前位置: 首页 > news >正文

图像描述编辑器 (Image Caption Editor)

YujunCui/ImageCaptionEditor: A graphical interface tool for editing image-text pair data, supporting two data formats: image_json_pair format and message format.https://github.com/YujunCui/ImageCaptionEditor一个用于编辑图像-文本对数据的图形界面工具,支持两种数据格式:image_json_pair格式和message格式。

如果有帮助到大家,请多多点赞!

功能特点

  • 支持两种数据格式:

    • image_json_pair格式:每个图像文件对应一个同名的JSON文件,JSON文件中包含图像描述信息

    • message格式:一个JSON文件包含多个图像描述条目,每个条目可以引用多个图像文件

  • 多语言界面支持(中文/英文)

  • 图像预览功能,支持缩放

  • 文本编辑区域,支持JSON格式的描述编辑

  • 导航功能:支持前后浏览、跳转到指定图像

  • 键盘快捷键支持,提高操作效率

界面介绍

主要组件

  1. 左侧控制面板

    • 语言选择:支持中英文界面切换

    • 模式选择:选择数据格式(image_json_pair或message)

    • 目录设置:选择包含数据的目录

    • 图像导航:前后浏览图像,跳转到指定图像

    • 文本编辑:进入编辑模式

    • 信息显示:显示图像总数等信息

  2. 右侧显示区域

    • 图像预览区域:显示当前图像,支持缩放

    • 文本编辑区域:显示和编辑图像描述的JSON数据

使用方法

数据格式说明

image_json_pair格式

该格式要求每个图像文件都有一个对应的同名JSON文件,例如:

data/
├── image1.jpg
├── image1.json
├── image2.png
└── image2.json

其中JSON文件内容格式如下:

[{"vision_path": "D:\\Data\\mllm_testdata\\test_imgs\\有肢体冲突\\0.jpg","answer": "一对情侣在户外,互相嬉闹,背景有树木和蓝天。"}
]
message格式

该格式使用一个JSON文件包含所有图像描述信息:

[{"messages": [{"content": "<image>请简短描述图片内容。","role": "user"},{"content": "一对情侣在户外互相嬉闹,背景有树木和蓝天。","role": "assistant"}],"images": ["D:\\Data\\mllm_testdata\\test_imgs\\有肢体冲突\\0.jpg"]},{"messages": [{"content": "<image>请简短描述图片内容。","role": "user"},{"content": "四人围成一圈,用竹竿互相推搡。","role": "assistant"}],"images": ["D:\\Data\\mllm_testdata\\test_imgs\\有肢体冲突\\71a046b26d52218a15be3fecc938f246.jpeg"]}
]

操作指南

  1. 选择数据目录

    • 点击"选择目录"按钮,选择包含图像和JSON文件的目录

  2. 浏览图像

    • 使用"第一张"、"上一张"、"下一张"、"最后一张"按钮导航

    • 使用键盘快捷键:Home(第一张)、End(最后一张)、F(下一张)、D(上一张)

    • 在跳转输入框中输入序号直接跳转到指定图像

  3. 查看图像

    • 图像会自动显示在左侧预览区域

    • 使用鼠标滚轮上下滚动查看多张图像

    • 使用Ctrl+鼠标滚轮进行图像缩放,但是图像会被限制在图像预览区域

  4. 编辑描述

    • 点击"编辑文本"按钮或按E键进入编辑模式

    • 在文本编辑区域修改JSON格式的描述内容

    • 按Ctrl+S保存修改,或按Esc取消编辑

    • 点击"保存修改"按钮确认保存,或点击"退出编辑"按钮放弃修改

  5. 界面语言切换

    • 在"Language / 语言"选项中选择English或中文

快捷键列表

快捷键功能
Ctrl+S保存修改
Ctrl+Z撤销
Ctrl+Y重做
Esc退出编辑模式
E进入编辑模式
F下一张图像
D上一张图像
Home第一张图像
End最后一张图像
Ctrl+鼠标滚轮图像缩放
Ctrl+0重置图像缩放

注意事项

  1. 确保JSON文件格式正确,否则可能导致程序出错

  2. 图像文件和JSON文件需要正确对应

  3. 在message格式中,图像路径可以是绝对路径或相对于JSON文件的相对路径

  4. 编辑时请保持JSON格式的正确性,否则无法保存

  5. 程序会自动保存每张图片的缩放状态,方便再次查看时保持相同的缩放比例

  6. 程序在处理大量数据时可能会卡顿,请分批处理

http://www.dtcms.com/a/359755.html

相关文章:

  • 文字的力量:Qwen-Image如何让AI真正“读懂”中文之美
  • HTTPS -> HTTP 引起的 307 状态码与HSTS
  • ans.1中的对象标识符OBJECT_IDENTIFIER----OID
  • 【开题答辩全过程】以 基于springboot的垃圾分类管理系统为例,包含答辩的问题和答案
  • 力扣热题100:合并区间详解(Java实现)(56)
  • 历史数据分析——寒武纪
  • Android开发-活动页面
  • 20.28 《4bit量化模型预处理揭秘:如何节省75%显存高效微调LLM?》
  • leetcode-hot-100(堆)
  • 金融学-货币理论
  • Kafka应用过程中的高频问题
  • 【Linux基础】深入理解计算机存储:GPT分区表详解
  • 对于牛客网—语言学习篇—编程初学者入门训练—复合类型:BC136 KiKi判断上三角矩阵及BC139 矩阵交换题目的解析
  • uvm验证环境中struct(结构体)和class的区别与联系
  • 使用AdaLoRA 自适应权重矩阵微调大模型介绍篇
  • 接口测试总结-含接口测试和前端测试的区别与比较
  • PyTorch 张量(Tensor)详解:从基础到实战
  • 1.9 初始Memory Profiler Package
  • 面试 八股文 经典题目 - HTTPS部分(一)
  • Qt组件布局的经验
  • 深度学习数据加载实战:从 PyTorch Dataset 到食品图像分类全流程解析
  • 实现需求精准预测、运输路径优化及库存高效管理的智慧物流开源了
  • 利用 Java 爬虫获取淘宝拍立淘 API 接口数据的实战指南
  • 图片格式转换v2_tif转png tif转jpg png转tif
  • mysql深度分页
  • JVM的四大组件是什么?
  • 【贪心算法】day5
  • 暄桐林曦老师关于静坐常见问题的QA
  • 矩阵待办ios app Tech Support
  • 好用的电脑软件、工具推荐和记录