当前位置: 首页 > news >正文

安装unsloth

我在llamafactory微调LLM,简单测了一些(很不精准),加速方法中unsloth比flash_attention速度快了40%,显存占用减少15%;

  1. 创建虚拟环境:conda create -n env_name python=3.10, 然后conda activate env_name
  2. 安装cudatoolkit:conda install cudatoolkit=12.1conda install nvidia/label/cuda-12.1.0::cuda-toolkit,可能失败
  3. 安装pytorch、triton和xformers:pip install torch==2.4.0 triton pip install xformers==0.0.27.post2 --index-url https://download.pytorch.org/whl/cu121(如果第二步失败,这步也会配上cuda环境)(嫌慢可以先去https://download.pytorch.org/whl/cu121把包下好,不过记得这几个包一起安装,不然可能会覆盖前面安装的,例如单独安装triton和xformers会下载cpu版torch)
  4. 安装unsloth:pip install "unsloth[cu121-torch240] @ git+https://github.com/unslothai/unsloth.git"或者pip install --upgrade --force-reinstall --no-cache-dir git+https://github.com/unslothai/unsloth.git
  5. 记得比对一下包的版本是不是如上所述,因为有的包可能会把依赖包卸了装个新的。。(包不太容易安装,依赖很复杂,所以不建议用--no-deps--ignore-installed等方式)

第5步有大佬在博客说要装ampere,我是没装也能用(尝试装了下,在flash-attn那里卡住了),仅供参考:pip install "unsloth[cu121-ampere-torch240] @ git+https://github.com/unslothai/unsloth.git"

相关文章:

  • 第三天 开始Unity Shader的学习之旅之第二天的补充
  • 5G智慧工厂专网部署:IPLOOK助力制造业数字化转型
  • 我爱学算法之——滑动窗口攻克子数组和子串难题(中)
  • 架构思维:如何设计一个支持海量数据存储的高扩展性架构
  • Redis、Memcached应用场景对比
  • JSON数据修改的实现
  • Maven的常用命令及版本冲突
  • Linux常用的命令
  • OpenCV旋转估计(3)帮助构建一个最大生成树(Maximum Spanning Tree)函数findMaxSpanningTree()
  • 聊聊langchain4j的HTTP Client
  • 关于MTU的使用(TCP/IP网络下载慢可能与此有关)
  • HJ C++11 Day6
  • Spring事务管理
  • 数据仓库的 DWD 分层架构:构建高效数据平台的基石
  • 科技重构旗舰SUV:腾势N9上市38.98万起
  • C++红黑树实现
  • 深度学习2-线性回归表示
  • 【读书笔记】华为《从偶然到必然》
  • SMBus协议(二):与I2C协议的对比
  • 5、linux c 线程 - 上
  • 看展 | 黄永玉新作展,感受赤子般的生命力
  • 中央提级巡视后,昆明厅官郭子贞接受审查调查
  • 【社论】城市更新,始终以人为核心
  • 音乐节困于流量
  • 蒋圣龙突遭伤病出战世预赛存疑,国足生死战后防线严重减员
  • 温州通报“一母亲殴打女儿致其死亡”:嫌犯已被刑拘