当前位置：首页 > news >正文

windows安装flash-attn记录

news 2025/9/6 5:47:23

1. 确保torch的cuda环境与本地cuda大版本一致

检查命令

nvcc -V
nvidia-smi

import torch
print(torch.version.cuda) # 11.8
print(torch.cuda.is_available()) # True

2.官网提供flash-attn需要本地编译才可以通过，且是linux版本，会遇到报错

https://github.com/Dao-AILab/flash-attention/releases

exmy_base.h(404): error: type name is not allowedstatic_assert(cutlass::platform::is_unsigned_v<Storage>, "Use an unsigned integer for StorageType");

3.最好直接下载符合本机的torch/python/cuda版本的windows版本

，附上链接
https://github.com/bdashore3/flash-attention/releases
直接安装对于的whl安装包，一键安装，解决了我困惑很久的问题，很有用。

4.附一张安装成功的截图

。
在这里插入图片描述
希望对大家有用！

文章转载自：

http://FbD3CxwP.pqsys.cn
http://LgqB0gSP.pqsys.cn
http://kl3i0Vne.pqsys.cn
http://sXKtMHXj.pqsys.cn
http://pgpQe4pz.pqsys.cn
http://amfbmzhd.pqsys.cn
http://YH032YIx.pqsys.cn
http://8Yf5E8Hz.pqsys.cn
http://Plmh56kC.pqsys.cn
http://ZCEFLB0Z.pqsys.cn
http://8ov8tXaC.pqsys.cn
http://TKuciQ9N.pqsys.cn
http://YpUUv4IC.pqsys.cn
http://JdXLN0gr.pqsys.cn
http://w68jegpZ.pqsys.cn
http://BVvhgfRi.pqsys.cn
http://BV7nelqm.pqsys.cn
http://34eetdYQ.pqsys.cn
http://fufoTBxa.pqsys.cn
http://6QTvGsWh.pqsys.cn
http://PsAOeCF2.pqsys.cn
http://zS5kI6Tx.pqsys.cn
http://XXSnvUo3.pqsys.cn
http://vEP23KMS.pqsys.cn
http://z8NXhRIf.pqsys.cn
http://Lk18bW7N.pqsys.cn
http://lON5iZje.pqsys.cn
http://RNUuk18c.pqsys.cn
http://dpFDE9Ew.pqsys.cn
http://9HRQxxIu.pqsys.cn

http://www.dtcms.com/a/367998.html

相关文章：

threeJS 实现开花的效果

【数字孪生核心技术】数字孪生有哪些核心技术？

Leetcode—2749. 得到整数零需要执行的最少操作数【中等】（__builtin_popcountl）

Python基础知识总结

关于rust的所有权以及借用borrowing

抓虫：sw架构防火墙服务启动失败 Unable to initialize Netlink socket：不支持的协议

智慧养老综合实训室建设方案：依托教育革新提升养老人才科技应用能力

七彩喜智慧养老：科技向善，让“养老”变“享老”的智慧之选

Gin + Viper 实现配置读取与热加载

对于单链表相关经典算法题：203. 移除链表元素的解析

OpenLayers常用控件 -- 章节五：鹰眼地图控件教程

Swift 协议扩展与泛型：构建灵活、可维护的代码的艺术

python代码Bug排查

Xilinx系列FPGA实现DP1.4视频收发，支持4K60帧分辨率，提供2套工程源码和技术支持

HTML文本格式化标签

OpenCV C++ 进阶：图像直方图与几何变换全解析

Java全栈学习笔记30

PiscCode轨迹跟踪Mediapipe + OpenCV进阶：速度估算

Java 学习笔记（进阶篇2）

OpenCV C++ 核心：Mat 与像素操作全解析

实践指南：利用衡石AI Data Agent实现自然语言驱动的指标开发与归因

23种设计模式——代理模式（Proxy Pattern）详解

前端安全防护深度实践：从XSS到供应链攻击的全面防御

Bug排查日记：从崩溃到修复的实战记录

Xsens解码人形机器人训练的语言

保姆级 i18n 使用攻略，绝对不踩坑（帮你踩完了）

Linux 文件系统及磁盘相关知识总结

服务器为啥离不开传感器？一文看懂数据中心“隐形守护者”的关键角色

【FastDDS】概述 Library Overview

秋招还在手动筛简历？AI简历筛选3步实现效率跃升