当前位置: 首页 > news >正文

上传模型/数据集到huggingface的三种方法

在进行上传之前,需要一个有仓库write权限的token,去这里创建:https://huggingface.co/settings/tokens (点击 Create New Token)
本文中出现的所有命令行都可以通过 加 ! 在JupterNotebook中运行,前提是需要在本地虚拟环境装好对应的包,例如方法三需要这样安装依赖pip install huggingface_hub[hf_transfer]

1. 首选:huggingface-cli

在使用pip等工具全局或者在代码目录下安装huggingface-cli后,可以运行

huggingface cli create repo 用户名/仓库名 手动初始化一个huggingface repo

假设用户名是steve,上传之后的模型名字是 whisper-large-v3-finetuned 那么需要运行的上传命令如下。
huggingface-cli upload steve/whisper-large-v3-finetuned . ./

其中第一个 . 表示上传文件的来源文件夹,例如我现在在 ./openai_whisper-large-v3-finetuned-20251010_225331/checkpoint-500 目录内运行这个huggingface-cli命令,那么直接写. 代表当前目录。如果在上一级运行目录,则填写 ./checkpoint-500 读取一下子目录里的文件

第二个 ./ 代表上传到huggingface里的repo库的目标存放路径,假设我这次只想上传到 zh 这个文件夹里下次继续上传,那就直接写 ./zh

2. 次选: push_to_hu 方法

from transformers import WhisperForConditionalGeneration, WhisperProcessor
from huggingface_hub import notebook_login
from huggingface_hub.hf_api import HfFolder
a
# 登陆到huggingface
notebook_login()# --- CONFIGURATION ---
# 1. Set the path to your best model's directory
best_model_dir="./openai_whisper-large-v3-finetuned-20251010_225331/checkpoint-500", 
# 注意这里的文件路径下面就是`config.json`和 `model.safetensors`等文件# 2. Set the name for your new repository on the Hugging Face Hub
hub_repo_name = "whisper-large-v3-finetuned" # --- LOAD & PUSH ---
# Load the fine-tuned model and processor from your local directory
model = WhisperForConditionalGeneration.from_pretrained(best_model_dir)
processor = WhisperProcessor.from_pretrained(best_model_dir)# Push the model and processor to the Hub
model.push_to_hub(hub_repo_name, private=True) # 这里可以设置是否公开这个repo
processor.push_to_hub(hub_repo_name, private=True)

3. 推荐:hf_transfer方法(最快最稳定)

最近训练了个总大小不超过3gb的但由于网络问题。方法1和方法2频繁出错,最后尝试了 hf_transfer 一次成功:

先去命令行运行 huggingface cli create repo 用户名/仓库名 ,这一步其实就是在hf初始化git仓库。

然后回到python代码, 添加如下环境变量(平时下载多于上传的情形建议在Windows系统环境变量或bashrc中设置HF_ENDPOINT=https://hf_mirror.com 而不是 huggingface.co 确保速度,需要再改endpoint)

# 设置临时系统环境变量
os.environ["HF_HUB_ENABLE_HF_TRANSFER"] = "1"
os.environ["HF_ENDPOINT"] = "https://huggingface.co/"

我这里习惯存一个token到本地,这样运行和huggingface-cli交互的代码都不需要额外登录了。可以放在其它代码最前面

from huggingface_hub.hf_api import HfFolder
hf_token = HfFolder.save_token('hf_abdedaddqwdqw') 

直接上传,这里速度要比前面两个方法快速和稳定很多:

api.upload_folder(folder_path="./openai_whisper-large-v3-finetuned-20251010_225331/checkpoint-500", # 注意这里的文件路径下面就是`config.json`和 `model.safetensors`等文件repo_id="hf用户名/你的模型名称",repo_type="model",  # or "model", "space"
)

在这里插入图片描述

http://www.dtcms.com/a/610066.html

相关文章:

  • 33_FastMCP 2.x 中文文档之FastMCP客户端核心业务:提示模板详解
  • wordpress插件访客亚马逊seo推广
  • Juc篇-线程安全问题引入(从i++问题的底层出发)
  • Arbess V2.1.7版本发布,新增任务AliYun OSS上传、下载功能,新增流水线评审功能
  • 算法基础篇:(八)贪心算法之简单贪心:从直觉到逻辑的实战指南
  • 昊源建设监理有限公司网站外贸网站代码
  • 大专生就业:学历限制的现实考量与能力突围路径
  • Node.js 与 Docker 深度整合:轻松部署与管理 Node.js 应用
  • 中国企业500强榜单2021廊坊seo排名优化
  • 基于高光谱成像和偏最小二乘法(PLS)的苹果糖度检测MATLAB实现
  • 随访系统如何支持临床研究和数据分析?
  • idea 刷新maven,提示java.lang.RuntimeException: java.lang.OutOfMemoryError
  • 邢台本地网站vue做的pc线上网站
  • Arang Briket木炭块检测与识别:基于Mask R-CNN的精确识别方案详解
  • 怎么在百度建设一个网站工业设计大学排名前50
  • 【C++:封装红黑树】C++红黑树封装实战:从零实现MyMap与MySet
  • 构建AI智能体:九十四、Hugging Face 与 Transformers 完全指南:解锁现代 NLP 的强大力量
  • 保定网站排名哪家公司好有没一些网站只做临床药学
  • 目前做网站流行的语言网站策划书市场分析2000字
  • 18.HTTP协议(一)
  • 【每天一个AI小知识】:什么是逻辑回归?
  • Moe框架分析
  • Windows下nacos开机自启动
  • C++ 11 中的move赋值运算符
  • Java:startsWith()
  • 【Linux】进程间通信(四)消息队列、信号量与内核管理ipc资源机制
  • php整站最新版本下载html5 网站开发工具
  • wordpress更换网站数据库中国网络公司排名前十
  • 病床脚轮制动系统公差优化:CETOL 6σ建模与装配顺序重构,根治对中漂移
  • 专注网站建设与制作做网站费用多少钱