当前位置: 首页 > news >正文

win11编译pytorch cuda128版本流程

Geforce 50xx系显卡最低支持cuda128,torch cu128 release版本目前还没有释放,所以自己基于2.6.0源码自己编译wheel包。

1. 前置条件

1. 使用visual studio installer 安装visual studio 2022,工作负荷选择【使用c++的桌面开发】,安装完成后将“VC\Tools\MSVC\<版本号>\bin\Hostx64\x64”对应的路径加入环境变量;

2. 访问https://github.com/pytorch/pytorch/releases/download/v2.6.0/pytorch-v2.6.0.tar.gz下载源码,可以替换成kkgithub镜像访问;

3. 访问https://github.com/conda-forge/miniforge/releases/download/24.11.3-0/Miniforge3-Windows-x86_64.exe安装miniforge;

2. 编译

打开 Miniforge Prompt,依次执行如下代码:

##如果访问报错或速度缓慢,搜索并替换conda、pip清华源
conda create torch_build_env python=3.10 libuv
conda activate torch_build_env
conda install -y astunparse numpy ninja pyyaml setuptools cmake cffi typing_extensions future six requests dataclasses

set MAX_JOBS=24
set USE_DISTRIBUTED=OFF
set USE_CUDA=ON
set PYTORCH_BUILD_VERSION=2.6.0a0+cu128-cp31016-win_x64
set PYTORCH_BUILD_NUMBER=0 


##执行前先确保删除build目录
python setup.py bdist_wheel

编译完成后,wheel包在dist目录下,使用pip安装

pip install dist\torch-2.6.0a0+cu128.cp31016.win.x64-cp310-cp310-win_amd64.whl

相关文章:

  • wav格式的音频压缩,WAV 转 MP3 VBR 体积缩减比为 13.5%、多个 MP3 格式音频合并为一个、文件夹存在则删除重建,不存在则直接建立
  • 笔记:大模型Tokens是啥?为啥大模型按Tokens收费?
  • PyQt5入门教程和简单使用
  • Pandas在爬虫中的应用:快速清洗和存储表格数据
  • 【北京迅为】itop-3568 开发板openharmony鸿蒙烧写及测试-第2章OpenHarmony v3.2-Beta4版本测试
  • js逆向常用代码
  • 使用 Polars 进行人工智能医疗数据分析(ICU数据基本测试篇)
  • 毛泽东思想“活的灵魂”
  • 黑马Java面试教程_P5_微服务
  • ISO 15118,最新版,汽车充电桩相关标准,1~22子标准
  • Postman 11.34 最新版安装与API测试入门教程(Windows平台)
  • 释放 Cursor 的全部潜能:快速生成智能 Cursor Rules
  • Linux中子线程会继承父线程对相关变量的可见性
  • redis --- 相关基础知识整理
  • RNN,LSTM,GRU三种循环网络的对比
  • 解决单元测试 mock final类报错
  • 盛京开源社区加入 GitCode,书写东北开源生态新篇章
  • 深入理解Java并发编程(一):揭秘并发性能优化的底层机制
  • 想转行做春晚那种扭秧歌的机器人,大概要会点什么?
  • 【SpringBoot】论坛项目中如何进行实现发布文章,以及更新对应数据库的数据更新
  • “敌人已经够多了”,菲总统马科斯:愿与杜特尔特家族和解
  • 国家发改委谈稳定外资:将研究制定鼓励外资企业境内再投资政策措施
  • 鸿蒙电脑正式发布,余承东:国产软件起步晚,基础弱,探索面向未来的电脑体验
  • 视频丨为救心梗同学缺席职教高考的小伙姜昭鹏完成补考
  • 墨西哥海军一载两百余人帆船撞上纽约布鲁克林大桥,多人落水
  • 广东缉捕1名象牙走私潜逃非洲“红通”逃犯