当前位置: 首页 > news >正文

关于Ubuntu的 update造成的内核升级

背景:

注:当前状态无业游民,如有合适工作岗位求捞:个人简历。

proxmox8虚拟化的Ubuntu vm实例,vm实例做了显卡直通:Proxmox VE 8.4 显卡直通完整指南:NVIDIA 2080 Ti 实战。安装了 NVIDIA cuda驱动,搭建了comfyui:ubuntu 22.04 anaconda comfyui。前几天刚刚升级了proxmox8到proxmox9:proxmox8升级到proxmox9。

今天启动comfyui突然出现了异常:

使用如下命令启动comfyui:

systemctl start comfyui
systemctl status comfyui

但是浏览器访问15070端口无法访问:

执行netstat命令发现 15070端口确实没有监听:

netstat -ntlp

继续执行 systemctl status comfyui 发现:No CUDA GPUs are available

排查过程:

proxmox测排查

难道proxmox系统升级,pci直通失效了?登录web控制台发现vm实例pci设备在:

vm实例测排查

使用shell登录vm实例执行如下命令,NVIDIA设备也在。但是应该是驱动掉了

nvidia-smi
lsmod |grep nvidia
dmesg | grep -i nvidia
uname -a
lspci | grep -i vga

我是直接偷懒重新安装了一下显卡驱动:

cd /data/soft/
./NVIDIA-Linux-x86_64-570.144.run

参照:ubuntu22.04安装显卡驱动与cuda+cuDNN

启动comfyui测试

使用如下命令启动comfyui,测试程序是否启动:

systemctl start comfyui
systemctl status comfyui
netstat -ntlp

执行执行如

复盘:

什么造成的这种问题呢?仔细想了一下,我有执行过apt-get upgrade apt-get update命令:

是否是发生了内核升级?,如何避免这种状况呢?

禁止内核自动升级

锁定当前内核版本

# 查看当前内核版本
uname -r
# 锁定linux-image和linux-headers包
sudo apt-mark hold linux-image-generic linux-headers-generic
sudo apt-mark hold linux-image-$(uname -r) linux-headers-$(uname -r)
# 搜索并列出当前系统中所有被标记为“保留(hold)”状态的软件包
dpkg --get-selections | grep hold

通过这次update代理的思考:

  1. vm实例的备份还是很有必要的(当然了主要我这里是个人的测试环境,正式环境肯定会随时备份镜像)
  2. 用习惯了 redhat系列的 centos rockylinux 操作系统。没有锁定内核的习惯,对于Ubuntu操作系统hold一些关键的内核or其他软件包还是很有必要的。

文章转载自:

http://sDRzFKNr.dmwbs.cn
http://vZ0Nr49y.dmwbs.cn
http://fnwXmyMZ.dmwbs.cn
http://YHtn9UvI.dmwbs.cn
http://LAvqYVTL.dmwbs.cn
http://MMZcCYnV.dmwbs.cn
http://2494C6W9.dmwbs.cn
http://dIrXCkRP.dmwbs.cn
http://FOmaOZoL.dmwbs.cn
http://K8mQZSIV.dmwbs.cn
http://Vdtc4q4w.dmwbs.cn
http://2qKtMX8m.dmwbs.cn
http://aW6Xez28.dmwbs.cn
http://9C8mJet9.dmwbs.cn
http://8hc3X4XA.dmwbs.cn
http://H5YXimYF.dmwbs.cn
http://hqK6PZV9.dmwbs.cn
http://lahbRQJr.dmwbs.cn
http://FIIqNlAE.dmwbs.cn
http://8g3L41eA.dmwbs.cn
http://shDxJ5op.dmwbs.cn
http://w5E9WfTD.dmwbs.cn
http://6XhsMOwN.dmwbs.cn
http://QRU05Loh.dmwbs.cn
http://xy0dyBBY.dmwbs.cn
http://j5DLDjgZ.dmwbs.cn
http://16zz5YbN.dmwbs.cn
http://fzaoOHzb.dmwbs.cn
http://HGQ670YQ.dmwbs.cn
http://MZAgJRvp.dmwbs.cn
http://www.dtcms.com/a/376199.html

相关文章:

  • Ubuntu 22.04 安装 ROS 2 Humble 笔记
  • 基于数据挖掘的单纯冠心病与冠心病合并糖尿病的证治规律对比研究
  • LeetCode每日一题,20250910
  • Linux防火墙firewalld
  • JNI初识
  • Linux 系统中高性能 I/O 事件通知机制的核心——`epoll_create` 系统调用
  • UNIX与Linux:五大核心差异解析
  • 大模型评测工程师学习清单与计划
  • 5.后台运行设置和包设计与实现
  • 深度学习入门:打好数学与机器学习基础,迈向AI进阶之路
  • 【AOSP 的分层设计理念与命名规范】
  • Docker 清理完整指南:释放磁盘空间的最佳实践
  • 进程状态(Linux)
  • Linux负载如何判断服务器的压力
  • 【网络编程】从与 TCP 服务器的对比中探讨出 UDP 协议服务器的并发方案(C 语言)
  • 第4讲 机器学习基础概念
  • 新加坡服务器连接速度变慢应该做哪些检查
  • Elasticsearch启动失败?5步修复权限问题
  • HR软件选型指南:SaaS还是本地部署好?
  • 基于51单片机简易计算器仿真设计(proteus仿真+程序+嘉立创原理图PCB+设计报告)
  • matlab基本操作和矩阵输入-台大郭彦甫视频
  • Power BI制作指标达成跟踪器
  • 邪修实战系列(3)
  • Mac m系列芯片向日葵打不开 解决方案
  • 【Unity Shader学习笔记】(七)顶点着色器
  • 宋红康 JVM 笔记 Day16|垃圾回收相关概念
  • 信号与系统
  • 第十四届蓝桥杯青少组C++选拔赛[2023.2.12]第二部分编程题(5、机甲战士)
  • NW597NW605美光固态闪存NW613NW614
  • C语言-指针用法概述