当前位置: 首页 > news >正文

flash-attn安装卡在Building wheel for flash-attn (setup.py)

问题

pip install flash-attn
pip install flash-attn --no-build-isolation

都卡在uilding wheel for flash-attn (setup.py)这一步不动了。

解决方法

直接下载 GitHub Release 中的预编译 wheel: Dao-AILab/flash-attention

  1. 查看自己的版本
python -c "import torch; print(torch.__version__)" 
nvcc --version

例如输出为

torch.__version__ = 2.9.0+cu128
nvcc --version → CUDA 12.2

那么可以知道自己当下的版本是torch2.9 + cuda12.2

  1. 从release里找合适自己的预编译 wheel

我选择的是:flash_attn-2.8.3+cu12torch2.8cxx11abiFALSE-cp310-cp310-linux_x86_64.whl,从命名可以看出:

  • flash-attn2.8.3
  • cuda12 - 适配cuda12.2
  • torch2.8 - 因为使用的torch2.9是2.8的light,可以直接用2.8
  • cxx11abiFalse(一般都得用false,具体原因太长忘了)
  • cp310 - 适配python3.10
  1. 最后下载好whl进行安装,完成
pip install flash_attn-2.8.3+cu12torch2.8cxx11abiFALSE-cp310-cp310-linux_x86_64.whl
http://www.dtcms.com/a/545772.html

相关文章:

  • 【人工智能数学基础】什么是高斯分布/正态分布?
  • 医院网站建设策划怎么注册国外网站
  • 广州专业建网站公司微电影制作
  • 做网站买什么服务器上蔡专业网站建设
  • 计算机网络自顶向下方法15——应用层 P2P文件分发与BitTorrent协议
  • 深入理解 UDP:从协议基础到可靠实现与 QUIC 演进
  • wordpress 站点地址一个人建设小型网站
  • [人工智能-大模型-105]:模型层 - 为什么需要池化层,池化层的物理意义
  • 引流推广推广微信hyhyk1效果好亚马逊seo是什么
  • 统信桌面专业版安装应用显示架构不匹配怎么处理
  • Sqoop将MySQL数据导入HDFS
  • Rust 中的数据结构选择与性能影响:从算法复杂度到硬件特性 [特殊字符]
  • 做电脑网站手机能显示做网站学哪方面知识
  • 测试开发话题04---用例篇(1)
  • 44-基于ZigBee和语音识别的智能家居控制系统设计与实现
  • 锂离子电池恒流恒压充电(CC-CV)Simulink仿真模型
  • Rust安装
  • 做网站哈尔滨百度文档怎么免费下vvv
  • LangChain RAG 学习笔记:从文档加载到问答服务
  • XtraBackup 详解:MySQL 数据库备份与恢复的利器
  • 仿克米设计网站团队做网站分工
  • 化州+网站建设有那些专门做外贸的网站呀
  • ESP32-S3 小智 AI 开发环境搭建与固件编译烧录(MCP 控制 GPIO 点亮 LED 灯示例)
  • 算法 day 38
  • 构建AI智能体:七十八、参数的艺术:如何在有限算力下实现高质量的AI诗歌创作
  • 东网站建设有赞短链接生成
  • 怎么建设自己的卡盟网站wordpress如何自动采集网站图片
  • 做网站 挣广告联盟的佣金做网站的企业有哪些
  • RDP攻击(Remote Desktop Protocol Attack)是什么?
  • RK3576机器人核心:三屏异显+八路摄像头,重塑机器人交互与感知