当前位置: 首页 > news >正文

Label Studio 安装与简单使用指南

一、Label Studio 简介与安装

什么是 Label Studio?

Label Studio 是一个开源的数据标注工具。它允许您通过简单直观的 UI 标注音频、文本、图像、视频和时间序列等多种数据类型,并可以导出为各种模型格式。它既可以用于准备原始数据,也可以改进现有的训练数据以获得更准确的 ML 模型。

官方github地址https://github.com/HumanSignal/label-studio

Label Studio官网https://labelstud.io/

label-studio官方教程https://labelstud.io/guide/get_started.html#Quick-start

Label Studio 的核心功能

  • 多用户标注 - 注册和登录功能,创建的标注与您的账户关联

  • 多项目管理 - 在一个实例中处理所有数据集

  • 流线型设计 - 帮助您专注于任务,而不是软件使用

  • 可配置的标签格式 - 可自定义视觉界面以满足特定标注需求

  • 支持多种数据类型 - 包括图像、音频、文本、HTML、时间序列和视频

  • 从文件或云存储导入 - 支持 Amazon AWS S3、Google Cloud Storage,以及 JSON、CSV、TSV、RAR 和 ZIP 存档

  • 与机器学习模型集成 - 可视化和比较不同模型的预测,并执行预标注

  • 嵌入数据管道 - REST API 使其易于成为管道的一部分

安装方法

1. 使用 Docker 安装(推荐)

# 拉取官方镜像
docker pull heartexlabs/label-studio:latest# 运行容器(容器名称为label-studio)
docker run -d --name label-studio -p 8080:8080 -v $(pwd)/mydata:/label-studio/data heartexlabs/label-studio:latest

安装完成后直接访问 http://localhost:8080 即可使用 Label Studio,localhost为Docker所在主机的IP地址。例如,在笔记本浏览器中输入 http://192.168.0.1:8080 即可访问。

Docker容器常用指令

# 1. 启动已停止的容器
docker start <容器名># 2. 停止运行中的容器
docker stop <容器名># 3. 重启容器
docker restart <容器名># 4. 查看运行状态
docker ps# 5.查看所有容器(包括已停止的)
docker ps -a# 6. 查看日志
docker logs -f <容器名># 7. 删除容器(需要先停止)
docker rm <容器名>

2. 使用 Docker Compose 安装

# 启动完整的生产环境(Label Studio + Nginx + PostgreSQL)
docker-compose up

3. 使用 pip 安装

# 要求 Python >= 3.8
pip install label-studio# 启动服务
label-studio

4. 使用 conda 安装

conda create --name label-studio
conda activate label-studio
pip install label-studio

5. 从源码安装(开发模式)

git clone https://github.com/HumanSignal/label-studio.git
cd label-studio# 安装依赖
pip install -e .# 初始化数据库
python label_studio/manage.py migrate# 启动开发服务器
python label_studio/manage.py runserver

二、Label Studio 简单使用教程

Label Studio 简单使用教程

1. 启动与初始化

成功安装后,访问 http://localhost:8080 会看到注册页面:

创建账号并登录后,进入主界面。

2. 创建项目

点击 "Create Project" 创建新项目:

  • 项目名称:为项目起个有意义的名称

  • 描述:简要描述项目用途

3. 配置数据导入

在 "Data Import" 选项卡中,选择数据导入方式:

从本地上传文件

支持常见格式:图片(.jpg, .png)、文本(.txt)、音频(.wav, .mp3)等

从URL导入

直接输入数据文件的URL链接

云存储连接

支持 AWS S3、Google Cloud Storage、Azure Blob 等

4. 配置标注模板

在 "Labeling Setup" 中配置标注界面:

使用预置模板

Label Studio 提供多种预置模板:

  • 图像分类

  • 目标检测

  • 文本分类

  • 命名实体识别

  • 音频分类

  • 时间序列标注

修改预置模板里的标签:

红框里的预置标签都可以删除,然后在左侧文本框里逐一输入自己的标签后点击 Add 按钮。

自定义模板

使用XML格式自定义标注界面:

<View><Image name="image" value="$image"/><RectangleLabels name="label" toName="image"><Label value="Person" background="green"/><Label value="Car" background="blue"/></RectangleLabels>
</View>

常用标签类型:

  • Labels - 分类标签

  • RectangleLabels - 矩形框标注

  • PolygonLabels - 多边形标注

  • Text - 文本显示

  • TextArea - 文本输入

设置好我们需要的标签之后,点击右上角的Save,就可以跳到以下界面准备开始标注了。

5. 开始标注

图像标注示例

对于目标检测任务:

  1. 选择矩形框工具

  2. 在目标物体上绘制边界框

  3. 选择对应的类别标签

  4. 保存标注结果

该界面左侧是我们要标注的图像,右侧会显示标注点的信息,这里先点击一下左下角的person标签,而后就可以在图像中人头的部位通过点击来进行标注了。整张图的人头都标注完成后,要点击下方的Submit提交已标注的数据,随后就会跳到下一张图像的标注界面。

6. 查看任务完成情况

这里会有所有任务的汇总,包括标注时间,是否完成,标注人员,标注数量等。

7. 导出标注结果

完成标注后,在 "Export" 选项卡中导出数据:

支持的导出格式:

  • JSON

  • CSV

  • COCO(用于目标检测)

  • Pascal VOC(用于目标检测)

  • YOLO

  • YOLOv8 OBB

  • 自定义格式

示例导出代码:

# 在实际使用中通过Web界面导出
# 导出的JSON格式示例
{"id": 1,"annotations": [{"result": [{"value": {"x": 10, "y": 20, "width": 30, "height": 40,"rectanglelabels": ["Person"]}}]}]
}

8. 高级功能

机器学习辅助标注

集成ML模型进行预标注:

  1. 设置机器学习后端

  2. 配置模型预测接口

  3. 启用预标注功能

团队协作

  • 邀请团队成员

  • 分配标注任务

  • 跟踪标注进度

  • 质量控制和审核

常见问题解决

  • 数据导入失败:检查文件格式和大小

  • 标注保存失败:检查网络连接

  • 界面显示异常:清除浏览器缓存

总结

Label Studio 是一个功能强大且灵活的数据标注工具,通过本教程您可以快速上手基本的数据标注工作流。无论是个人项目还是团队协作,它都能提供良好的支持。

http://www.dtcms.com/a/578121.html

相关文章:

  • 宁波正规网站seo公司php网站开发机试题目
  • 牛客小白月赛122 D题x_to_y_2
  • 生态环境影响评价图件制作:融合ArcGIS与ENVI,掌握土地利用、植被覆盖、土壤侵蚀、水系提取等专题制图技术!
  • 深入理解 Vue3 Vapor 模式:从原理到实践
  • leeCode hot 100 !!!持续更新中
  • 想学网站建设选计算机应用技术还是计算机网络技术哪个专业啊网站建设工单系统护语
  • WordPress魔方格子做网站优化费用
  • 高校实验室建设方案解析:从规划到落地的全流程指南
  • javaweb前端基础
  • 从“会烧开水”到“知其所以然”:扩散模型文生图的理论基石
  • SQL注入之二次、加解密、DNS等注入
  • 网站开发速成班免费可商用的图片素材网站
  • 打破智能家居生态壁垒,乐鑫一站式Matter解决方案实现无缝互联
  • 用 CdcUp CLI 一键搭好 Flink CDC 演练环境
  • 【云运维】zabbix管理(续)
  • centos安装ES
  • 网站子目录是什么南通制作公司网站
  • 怎样设计网站或网页怎么样在百度做网站
  • SELinux 布尔值详解:灵活调整安全策略的开关
  • 李宏毅机器学习笔记41
  • 1-GGML:看ctx是个什么东西
  • 【Java SE 基础学习打卡】02 计算机硬件与软件
  • SDIO(Secure Digital Input Output,安全数字输入输出)
  • wordpress批量下载外链图片长春网站推广优化公司
  • 在 Ubuntu 上安装 Ollama 并通过 Open WebUI 运行本地大语言模型
  • 用Python来学微积分34-定积分的基本性质及其应用
  • 如何做网站代码荥阳市城乡建设规划网站
  • Jmeter+ant+Jenkins 接口自动化框架-让jmeter脚本自己跑起来
  • 宝安区住房和建设局网站河南做网站多少钱
  • Java集合框架:深入理解List与Set及其实现类