当前位置: 首页 > news >正文

ubuntu 系统风扇控制软件 CoolerControl

背景

A6000显卡的温度一直都是86度左右,GPU的风扇转速不够大。
我首先把 nvidia的驱动更新了,但是发现风扇依然依然保持在较低的转速。
后面无意间搜到了CoolerControl 这个linux平台的风扇控制软件。设置之后,增加了风扇的转速,现在可以把GPU的温度控制在80度以下。

具体操作

参考教程:https://cn.linux-terminal.com/?p=8335

支持风扇固定转速与按照曲线设置转速。

下述图片是按照这个曲线控制风扇的转速,达到不同的温度,风扇保持不同的转速。不仅可以控制CPU的风扇还可以控制GPU的风扇。

CoolerControl 视频教程:https://www.bilibili.com/video/BV1oF9yYFEvc/
我发现B站和youtube关于CoolerControl软件的教程,其中主要也就是设置下面的曲线。

在这里插入图片描述

题外话

A6000显卡温度在85度以上,我早就注意到了,不想折腾,一直都懒得管。我发现在训练模型的时候,windows把GPU的温度压的比较好,一直都70度以下。Windows训练大模型不方便,还是得使用 linux 训练大模型。

我很多次使用 llamafactory 微调大模型的时候,模型训练一半linux系统就崩溃了,必须得按关机键重启。
首先,我便怀疑是不是显卡温度过高触发了硬件的保护机制,导致系统崩溃。后面我发现把GPU的温度压下来后,训练大模型依然会崩溃。
因为nvidia的驱动已经更新过了,不是驱动的问题。于是我把python环境从3.11升级到3.12,再把 llamafactory 的包重新安装了一遍,在装包的过程中,我发现安装了很多与nvidia相关的包。然后再训练大模型就不崩溃了。

http://www.dtcms.com/a/311024.html

相关文章:

  • 烽火HG680-KD_海思MV320处理器-安卓9-原厂系统升级包-针对解决烧录不进系统的问题
  • 【Docker】RK3576-Debian上使用Docker安装Ubuntu22.04+ROS2
  • YOLO的Python实现以及 OpenCV
  • 分布式微服务--Nacos作为配置中心(补)关于bosststrap.yml与@RefreshScope
  • 分布式微服务--Nacos作为配置中心(二)
  • 多线程(一) ~ 进程与线程的区别
  • 深入 Go 底层原理(五):内存分配机制
  • 基于ELK Stack的实时日志分析与智能告警实践指南
  • 【vue】创建响应式数据ref和reactive的区别
  • React ahooks——副作用类hooks之useDebounceFn
  • Coze Studio 概览(六)--知识库管理
  • FreeRTOS源码分析一:task启动(RISCV架构)
  • 再见!三层框架开发
  • 【无标题】根据11维拓扑量子色动力学模型的严格计算宇宙轮回次数:
  • 谈谈WebAssembly、PWA、Web Workers的作用和场景
  • 论文阅读笔记:Dataset Condensation with Gradient Matching
  • 2023年影响重大的网络安全典型案例
  • OAuth 2.0 的安全升级版授权协议 OAuth 2.1 详解
  • 企业级单点登录(SSO)技术详解:从原理到安全实践
  • 华为核心交换机S7700的内存OID
  • k8s使用 RBAC 鉴权
  • 最新Windows11系统镜像,23H2 64位ISO镜像
  • Kafka——关于Kafka动态配置
  • 【MATLAB】(五)向量与多项式
  • 能力显著性向量:验证损失与下游能力的缩放定律
  • fastGEO v1.7.0 大更新,支持PCA、差异分析、火山图、热图、差异箱线图、去批次等分析
  • 二叉树算法之【Z字型层序遍历】
  • Lock 接口及实现类详解:从 ReentrantLock 到并发场景实践
  • Java web(02)
  • Javascript面试题及详细答案150道之(016-030)