当前位置: 首页 > news >正文

安装deepspeed时出现了以下的错误,如何解决CUDA_HOME does not exist

踩坑系列恢复更新

安装deepspeed时,主服务器装机时没有装cuda的编译器等一系列工具,导致pip时无法编译deepspeed包以及一系列依赖

具体错误:

$pip3 install deepspeed -i "http://yum.tbsite.net/pypi/simple/" --trusted-host "yum.tbsite.net" Looking in indexes: http://yum.tbsite.net/pypi/simple/ Collecting deepspeed Downloading http://yum.tbsite.net/pypi/packages/06/b3/a3903de5c5b707170c5c27e1a40f4ef613f14d241bd84d8b151a2a8786f6/deepspeed-0.16.7.tar.gz (1.5 MB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 1.5/1.5 MB 14.6 MB/s eta 0:00:00 Preparing metadata (setup.py) ... error error: subprocess-exited-with-error × python setup.py egg_info did not run successfully. │ exit code: 1 ╰─> [8 lines of output] Traceback (most recent call last): File "<string>", line 2, in <module> File "<pip-setuptools-caller>", line 35, in <module> File "/tmp/pip-install-bqu9rp8j/deepspeed_a2abcc73fa3f4d49b5d3a3d2862d6342/setup.py", line 110, in <module> cuda_major_ver, cuda_minor_ver = installed_cuda_version() File "/tmp/pip-install-bqu9rp8j/deepspeed_a2abcc73fa3f4d49b5d3a3d2862d6342/op_builder/builder.py", line 51, in installed_cuda_version raise MissingCUDAException("CUDA_HOME does not exist, unable to compile CUDA op(s)") op_builder.builder.MissingCUDAException: CUDA_HOME does not exist, unable to compile CUDA op(s) [end of output] note: This error originates from a subprocess, and is likely not a problem with pip. error: metadata-generation-failed × Encountered error while generating package metadata. ╰─> See above for output. note: This is an issue with the package mentioned above, not pip. hint: See above for details. (geocoding)

分析问题:

无nvcc这个cuda的编译工具,如何在不动root的全局环境下解决:

很简单,nvidia-smi查看cuda版本号,使用conda install安装一个cuda-toolkit即可解决

之后,可以正常pip deepspeed

相关文章:

  • 【Java面试笔记:进阶】28.谈谈你的GC调优思路?
  • 解决STM32H743单片机USB_HOST+FATF操作usb文件
  • 从 Pretrain 到 Fine-tuning:大模型迁移学习的核心原理剖析
  • 实验六 文件操作实验
  • CISC与RISC详解:定义、区别及典型处理器
  • 使用 ECharts 在 Vue3 中柱状图的完整配置解析
  • 【安全扫描器原理】端口扫描
  • 4.2.3 MYSQL事务原理分析
  • ESM模块加载机制全景解析
  • docker部署的Nextcloud,处于维护模式,如何解决
  • 程序员如何用AI工具实现“快速验证原型”
  • Linux环境变量以及进程虚拟地址原理
  • 共享货源系统,多商户独立站助力行业资源整合
  • [逆向工程]什么是CPU寄存器(三)
  • JavaScript原型,原型链 ? 有什么特点?
  • 第33周JavaSpringCloud微服务 多人协作下的调试
  • Docker与Vmware网络模式的对别
  • MongoDB的下载安装与启动
  • Laravel+API 接口
  • 爬虫学习笔记(五)---数据解析之re
  • 量子传感新技术“攻克”退相干难题
  • 俄罗斯纪念卫国战争胜利80周年阅兵式首次彩排在莫斯科举行
  • 中国人寿一季度净利润288亿增39.5%,营收降8.9%
  • 中办、国办印发《安全生产考核巡查办法》
  • 总书记考察的上海“模速空间”,要打造什么样的“全球最大”?
  • 被算法重塑的世界,人与技术如何和谐共处