当前位置: 首页 > news >正文

安装unsloth

我在llamafactory微调LLM,简单测了一些(很不精准),加速方法中unsloth比flash_attention速度快了40%,显存占用减少15%;

  1. 创建虚拟环境:conda create -n env_name python=3.10, 然后conda activate env_name
  2. 安装cudatoolkit:conda install cudatoolkit=12.1conda install nvidia/label/cuda-12.1.0::cuda-toolkit,可能失败
  3. 安装pytorch、triton和xformers:pip install torch==2.4.0 triton pip install xformers==0.0.27.post2 --index-url https://download.pytorch.org/whl/cu121(如果第二步失败,这步也会配上cuda环境)(嫌慢可以先去https://download.pytorch.org/whl/cu121把包下好,不过记得这几个包一起安装,不然可能会覆盖前面安装的,例如单独安装triton和xformers会下载cpu版torch)
  4. 安装unsloth:pip install "unsloth[cu121-torch240] @ git+https://github.com/unslothai/unsloth.git"或者pip install --upgrade --force-reinstall --no-cache-dir git+https://github.com/unslothai/unsloth.git
  5. 记得比对一下包的版本是不是如上所述,因为有的包可能会把依赖包卸了装个新的。。(包不太容易安装,依赖很复杂,所以不建议用--no-deps--ignore-installed等方式)

第5步有大佬在博客说要装ampere,我是没装也能用(尝试装了下,在flash-attn那里卡住了),仅供参考:pip install "unsloth[cu121-ampere-torch240] @ git+https://github.com/unslothai/unsloth.git"

http://www.dtcms.com/a/86000.html

相关文章:

  • 第三天 开始Unity Shader的学习之旅之第二天的补充
  • 5G智慧工厂专网部署:IPLOOK助力制造业数字化转型
  • 我爱学算法之——滑动窗口攻克子数组和子串难题(中)
  • 架构思维:如何设计一个支持海量数据存储的高扩展性架构
  • Redis、Memcached应用场景对比
  • JSON数据修改的实现
  • Maven的常用命令及版本冲突
  • Linux常用的命令
  • OpenCV旋转估计(3)帮助构建一个最大生成树(Maximum Spanning Tree)函数findMaxSpanningTree()
  • 聊聊langchain4j的HTTP Client
  • 关于MTU的使用(TCP/IP网络下载慢可能与此有关)
  • HJ C++11 Day6
  • Spring事务管理
  • 数据仓库的 DWD 分层架构:构建高效数据平台的基石
  • 科技重构旗舰SUV:腾势N9上市38.98万起
  • C++红黑树实现
  • 深度学习2-线性回归表示
  • 【读书笔记】华为《从偶然到必然》
  • SMBus协议(二):与I2C协议的对比
  • 5、linux c 线程 - 上
  • 基于STM32的两路电压测量仿真设计Proteus仿真+程序设计+设计报告+讲解视频
  • 使用LVS的 NAT 模式实现 3 台RS的轮询访问
  • (学习总结30)Linux 进程优先级、进程切换和环境变量
  • 使用LLM 构建MCP服务端和客户端
  • 信息安全和病毒防护——防火墙的作用
  • SFT和RLHF是什么意思?
  • Axure项目实战:智慧城市APP(四)医疗信息(动态面板、选中交互应用)
  • Jboss中间件漏洞攻略
  • java学习笔记6
  • 【云馨AI-大模型】大模型的开发和应用中,Python、PyTorch和vLLM关系概括