当前位置: 首页 > news >正文

【小白笔记】Hugging Face 下载:Git 到镜像网站的

问题起源:git clone 失败

事情是这样的,我最近想下载一个 Hugging Face 上的AI模型,名字叫 LatentSync-1.6。我像往常一样打开 Git Bash,输入了 git clone https://huggingface.co/ByteDance/LatentSync-1.6

结果,屏幕上跳出一个错误:fatal: unable to access ... Connection was reset

我心想,可能是网络不稳定吧,于是换了个方式,用 SSH 密钥来克隆:git clone git@hf.co:ByteDance/LatentSync-1.6

这次错误变了,变成了 Permission denied (publickey)。我这才意识到,我根本没配置过 Hugging Face 的 SSH 密钥,所以认证失败了。

看来,Git 这条路走不通了。


转战 huggingface-cli

我决定试试 Hugging Face 官方推荐的命令行工具:huggingface-cli

我先用 pip install huggingface_hub[cli] 命令安装了它,但安装完后,终端里跳出一个警告:WARNING: The scripts ... is not on PATH。原来,虽然安装成功了,但系统找不到这个命令。我需要手动把这个工具的路径添加到系统的环境变量 PATH 里。

我按照指引,打开了 Windows 的“环境变量”设置,把 C:\Users\xx\AppData\Roaming\Python\Python313\Scripts 这个路径加了进去。重启终端后,问题就解决了。

解决了 PATH 问题后,我尝试登录 Hugging Face,命令是 huggingface-cli login

结果终端里又出现一个警告:'huggingface-cli login' is deprecated. Use 'hf auth login' instead. 这告诉我,命令更新了,新的命令是 hf auth login。尽管旧的还能用,但我决定养成好习惯,以后都用新命令。

运行命令后,它让我输入一个“令牌”(Token),而不是密码。我这才知道,Hugging Face 的命令行登录需要一个个人访问令牌。打开给定的网站,点进去,然后登陆,复制token
在这里插入图片描述

登录成功!


我以为一切都顺利了,开始下载:huggingface-cli download ByteDance/LatentSync-1.6 --local-dir LatentSync-1.6

下载过程终于开始了!但没过多久,又出现错误:Read timed out。下载速度非常慢,而且不停地中断。我尝试了几次,都以失败告终。

原来,这是因为我的网络不稳定或者存在代理问题。尽管 huggingface-cli 已经很强大了,但在这种恶劣的网络环境下,它也无能为力。


终极解决方案:镜像网站 + IDM

在反复尝试失败后,我意识到问题根本不在于用哪个命令,而是我的网络环境就是无法稳定连接到 Hugging Face 的官方服务器

于是我找到了一个更直接的解决办法:使用镜像网站

我访问了一个名为 https://hf-mirror.com/ 的 Hugging Face 镜像网站。这个网站几乎复制了官方仓库的所有内容,但它服务器在国内,网络连接非常稳定。

我在这上面找到了我需要的 ByteDance/LatentSync-1.6 模型,然后直接点击下载。为了追求最快的下载速度和稳定性,我没有用浏览器自带的下载功能,而是使用了 IDM(Internet Download Manager) 这个多线程下载工具。IDM 能把一个大文件切成很多小块同时下载,大大提高了速度,并且完美支持断点续传。

最终,我在很短的时间内就顺利地下载了所有文件。


经验总结

  1. Git 克隆失败:如果反复因网络或认证问题失败,不要再执着于 Git。
  2. 命令行工具huggingface-cli 是一个强大的工具,但它依赖于稳定的网络连接。
  3. 终极杀手锏:如果你的网络环境对 Hugging Face 不友好,直接使用 hf-mirror.com 这样的镜像网站,配合 IDM 等多线程下载工具,这是最简单、最高效的解决方案。它能彻底绕开所有的网络限制和不稳定因素。
  4. IDM:https://blog.csdn.net/qq_61621323/article/details/141061544
http://www.dtcms.com/a/354230.html

相关文章:

  • 4-3.Python 数据容器 - 集合 set(集合 set 概述、集合的定义、集合的遍历、集合的常用方法)
  • Yolo系列 —— 使用自制数据集训练yolo模型
  • 2021/07 JLPT听力原文 问题一 1番
  • MQTT broker 安装与基础配置实战指南(一)
  • Java:IO流——增强篇
  • anaconda本身有一个python环境(base),想用别的环境就是用anaconda命令行往anaconda里创建虚拟环境
  • 英伟达 spectrum xgs 以太网 的含义和解释
  • 互联网大厂AI面试:从大模型原理到场景应用的深度解析
  • WPF 程序用户权限模块利用MarkupExtension实现控制控件显示
  • 嵌入式分层架构下的AT指令模块设计与实现
  • 使用Nginx搭建图片传输服务:配置与优化指南
  • Content-Type是application/x-www-form-urlencoded表示从前端到后端提交的是表单的形式
  • 微服务的编程测评系统17-判题功能-代码沙箱
  • 除自身以外数组的乘积是什么意思
  • 算法刷题常见错误
  • Linux 打包及压缩基础知识总结
  • 车间生产管理遇到的问题及改善方案有哪些?
  • 在 Windows 上部署 Go 语言开发环境
  • Go语言与Docker 开发的核心应用领域
  • 源码分析unexpected EOF on client connection with an open transaction
  • 分治法——二分答案
  • 深入探索Vue:前端开发的强大框架
  • Android10 音频系统之AudioPlaybackConfiguration
  • JVM之CMS、G1|ZGC详解以及选型对比
  • SynClub-百度在海外推出的AI社交产品
  • A-Level物理课程全解析:知识点、学习计划与培训机构推荐
  • 网络编程-连接、发送、接收数据学习
  • React Hooks 完全指南:从基础到高级的实战技巧
  • C++ 由 std::thread 初始化想到的
  • TencentOS Server 4.4 下创建mysql容器无法正常运行的问题