标注工具label-studio保姆级配置教程
这是一份超级详细的“保姆级”中文教程,手把手教你如何在Windows系统上配置和运行Label Studio项目。
Label Studio Windows环境保姆级配置教程
本教程将带你从零开始,在纯净的Windows环境上搭建、配置并成功运行Label Studio。我们将涵盖两种主要方式:
-
方式一:Pip快速安装(推荐新手) - 直接使用Python包管理器安装,简单快捷。
-
方式二:从GitHub源码运行(适合开发者) - 如果你想修改源码或体验最新功能,可以选择此方式。
第一步:安装必备软件 (Prerequisites)
在开始之前,我们需要确保电脑上安装了两个基础软件:Python和Git。
1. 安装 Python (建议 3.8 ~ 3.11版本)
-
下载: 访问 Python官网下载页面。选择一个推荐的版本(例如Python 3.10.11),根据你的系统是64位还是32位,下载对应的 "Windows installer"。
-
安装:
-
运行下载好的
.exe
安装包。 -
极其重要的一步: 在安装界面的最下方,务必勾选 "Add Python to PATH" 这个选项!这会省去你手动配置环境变量的麻烦。
-
然后点击 "Install Now" 进行默认安装即可。
-
-
验证安装:
-
按下
Win + R
键,输入cmd
并回车,打开命令提示符。 -
输入
python --version
并回车。如果显示出你安装的Python版本号,说明安装成功。 -
再输入
pip --version
并回车,如果也显示版本号,说明pip包管理器也已就绪。
-
2. 安装 Git
-
下载: 访问 Git for Windows官网。会自动开始下载适合你系统的安装包。
-
安装:
-
运行下载的安装包。
-
安装过程中,你可以一路点击 "Next" 使用默认设置完成安装。Git的默认设置对大多数用户来说都是最佳选择。
-
-
验证安装:
-
重新打开一个命令提示符窗口。
-
输入
git --version
并回车。如果显示出Git的版本号,说明安装成功。
-
第二步:创建项目环境
这是一个非常推荐的专业习惯:为你的每个Python项目创建一个独立的“虚拟环境”,以避免不同项目间的依赖包冲突。
-
创建项目文件夹:
在你的电脑上找一个合适的位置(例如 D:\projects\),创建一个新的文件夹,命名为 label-studio-project。
-
打开命令提示符到该目录:
在文件资源管理器中进入 label-studio-project 这个文件夹,然后在地址栏输入 cmd 并回车。这会直接在该目录下打开命令提示符。
-
创建虚拟环境:
在打开的命令提示符窗口中,输入以下命令并回车:
Bash
python -m venv venv
这个命令会创建一个名为
venv
的文件夹,里面存放着一个独立的Python环境。 -
激活虚拟环境:
继续在同一个窗口中,输入以下命令激活这个环境:
Bash
venv\Scripts\activate
激活成功后,你会看到命令行前面出现
(venv)
的字样。这表示你现在所有的Python操作都将在这个独立的环境中进行,不会影响到系统全局。
方式一:Pip快速安装 (推荐)
这种方式最简单,直接安装官方发布的稳定版。
-
安装Label Studio:
确保你已经处于激活了 (venv) 的命令提示符窗口中,然后执行以下命令:
Bash
pip install label-studio
pip
会自动下载并安装Label Studio及其所有依赖项。请耐心等待安装完成。 -
初始化并启动项目:
安装完成后,我们来创建并启动你的第一个标注项目。 初始化 Bash
label-studio init my_first_project
-
-
init
是初始化命令。
-
-
my_first_project
是你给项目起的名字,你可以换成任何你喜欢的英文名。这会在当前目录下创建一个文件夹来存放项目数据。 -
初始化成功后会让你输入一个密码,这里我们输入123456(也可按照自己能记住的来,最好简单一点) 启动 Bash
label-studio start my_first_project
-
start
是启动命令。
-
访问Label Studio:
命令执行后,你的默认浏览器会自动打开一个网址,通常是 http://localhost:8080。你将看到Label Studio的注册页面。创建一个管理员账户,登录后就可以开始创建项目、导入数据、设置标签,开始你的标注工作了!
方式二:从GitHub源码运行 (适合开发者)
如果你想研究它的代码,或者使用最新的、还未正式发布的功能,可以选择这种方式。
-
克隆源码:
确保你已经处于 label-studio-project 文件夹下,并且激活了虚拟环境 (venv)。执行以下命令从GitHub克隆项目源码:
Bash
git clone https://github.com/HumanSignal/label-studio.git
这会创建一个
label-studio
的子文件夹,并下载所有源码。 -
进入源码目录:
Bash
cd label-studio
-
安装依赖:
使用 pip 安装项目所需的所有依赖包。项目的依赖清单通常在 requirements.txt 文件里。
Bash
pip install -r requirements.txt
注意:有时候开发者版本的依赖会更复杂,如果上述命令失败,请查阅项目根目录下的
CONTRIBUTING.md
或pyproject.toml
文件,里面可能会有更详细的开发者环境搭建指南(例如可能需要使用poetry install
)。 -
运行数据库迁移:
首次从源码运行时,需要初始化数据库。
Bash
python label_studio/manage.py migrate
-
启动开发服务器:
一切就绪后,使用以下命令启动服务:
Bash
python label_studio/manage.py runserver
-
访问Label Studio:
服务启动后,在浏览器中手动访问 http://127.0.0.1:8000/ 或 http://localhost:8080 (具体端口看命令行的输出)。同样,你会看到注册页面,创建账户后即可开始使用。
常见问题与解决方法 (Troubleshooting)
-
问题1:
pip
命令执行缓慢或失败-
原因: 网络问题,访问国外服务器慢。
-
解决: 更换为国内的pip镜像源。可以执行以下命令临时更换:
Bash
pip install label-studio -i https://pypi.tuna.tsinghua.edu.cn/simple
-
-
问题2:提示
lxml
安装失败-
原因:
lxml
是一个C库的Python封装,在Windows上有时需要预编译的版本才能顺利安装。 -
解决:
-
访问 Christoph Gohlke的非官方Windows二进制包网站。
-
根据你的Python版本(如cp310代表Python 3.10)和系统架构(win_amd64是64位),下载对应的
.whl
文件。 -
使用
pip install
来安装你下载的这个文件,例如:Bash
pip install C:\path\to\your\downloads\lxml‑4.9.1‑cp310‑cp310‑win_amd64.whl
-
安装完
lxml
后,再重新尝试pip install label-studio
。
-
-
-
问题3:如何停止服务?
-
回答: 在运行服务的命令提示符窗口中,按下
Ctrl + C
组合键即可停止。
-
-
问题4:如何再次启动项目?
-
回答:
-
重新打开命令提示符,进入项目文件夹 (
label-studio-project
)。 -
激活虚拟环境 (
venv\Scripts\activate
)。 -
执行启动命令 (
label-studio start my_first_project
)。
-
-
希望这份超级详细的教程能帮助你顺利在Windows上把Label Studio跑起来!祝你标注愉快!