当前位置：首页 > news >正文

flash-attn安装卡在Building wheel for flash-attn (setup.py)

news 2025/10/30 11:12:26

问题

pip install flash-attn
pip install flash-attn --no-build-isolation

都卡在uilding wheel for flash-attn (setup.py)这一步不动了。

解决方法

直接下载 GitHub Release 中的预编译 wheel: Dao-AILab/flash-attention

查看自己的版本

python -c "import torch; print(torch.__version__)" 
nvcc --version

例如输出为

torch.__version__ = 2.9.0+cu128
nvcc --version → CUDA 12.2

那么可以知道自己当下的版本是torch2.9 + cuda12.2

从release里找合适自己的预编译 wheel

我选择的是：flash_attn-2.8.3+cu12torch2.8cxx11abiFALSE-cp310-cp310-linux_x86_64.whl，从命名可以看出：

flash-attn2.8.3
cuda12 - 适配cuda12.2
torch2.8 - 因为使用的torch2.9是2.8的light，可以直接用2.8
cxx11abiFalse(一般都得用false，具体原因太长忘了)
cp310 - 适配python3.10

最后下载好whl进行安装，完成

pip install flash_attn-2.8.3+cu12torch2.8cxx11abiFALSE-cp310-cp310-linux_x86_64.whl

http://www.dtcms.com/a/545772.html

相关文章：

【人工智能数学基础】什么是高斯分布/正态分布？

医院网站建设策划怎么注册国外网站

广州专业建网站公司微电影制作

做网站买什么服务器上蔡专业网站建设

计算机网络自顶向下方法15——应用层 P2P文件分发与BitTorrent协议

深入理解 UDP：从协议基础到可靠实现与 QUIC 演进

wordpress 站点地址一个人建设小型网站

[人工智能-大模型-105]：模型层 - 为什么需要池化层，池化层的物理意义

引流推广推广微信hyhyk1效果好亚马逊seo是什么

统信桌面专业版安装应用显示架构不匹配怎么处理

Sqoop将MySQL数据导入HDFS

Rust 中的数据结构选择与性能影响：从算法复杂度到硬件特性 [特殊字符]

做电脑网站手机能显示做网站学哪方面知识

测试开发话题04---用例篇（1）

44-基于ZigBee和语音识别的智能家居控制系统设计与实现

锂离子电池恒流恒压充电（CC-CV）Simulink仿真模型

Rust安装

做网站哈尔滨百度文档怎么免费下vvv

LangChain RAG 学习笔记：从文档加载到问答服务

XtraBackup 详解：MySQL 数据库备份与恢复的利器

仿克米设计网站团队做网站分工

化州+网站建设有那些专门做外贸的网站呀

ESP32-S3 小智 AI 开发环境搭建与固件编译烧录（MCP 控制 GPIO 点亮 LED 灯示例）

算法 day 38

构建AI智能体：七十八、参数的艺术：如何在有限算力下实现高质量的AI诗歌创作

东网站建设有赞短链接生成

怎么建设自己的卡盟网站wordpress如何自动采集网站图片

做网站挣广告联盟的佣金做网站的企业有哪些

RDP攻击(Remote Desktop Protocol Attack)是什么？

RK3576机器人核心：三屏异显+八路摄像头，重塑机器人交互与感知