当前位置: 首页 > wzjs >正文

网站建设有名的公司网站怎么做

网站建设有名的公司,网站怎么做,如何查看网站用什么代码做的,企业网站维护是指要让 Kubernetes (K8s) 集群 使用 GPU,并且节点是 KVM 虚拟化 出来的,需要确保以下几点: KVM 虚拟机透传 GPU(PCIe Passthrough) 宿主机和 K8s 节点正确安装 NVIDIA 驱动 K8s 集群安装 nvidia-device-plugin Pod 配…

要让 Kubernetes (K8s) 集群 使用 GPU,并且节点是 KVM 虚拟化 出来的,需要确保以下几点:

  1. KVM 虚拟机透传 GPU(PCIe Passthrough)

  2. 宿主机和 K8s 节点正确安装 NVIDIA 驱动

  3. K8s 集群安装 nvidia-device-plugin

  4. Pod 配置 GPU 资源请求


1. KVM 虚拟机透传 GPU(PCIe Passthrough)

要让 KVM 虚拟机直接访问 GPU,必须启用 PCIe Passthrough(VFIO 直通)。

步骤 1:宿主机启用 IOMMU

编辑 /etc/default/grub,修改 GRUB_CMDLINE_LINUX

GRUB_CMDLINE_LINUX="intel_iommu=on iommu=pt"  # Intel CPU
# 或
GRUB_CMDLINE_LINUX="amd_iommu=on iommu=pt"    # AMD CPU

更新 GRUB 并重启:

sudo update-grub
sudo reboot

验证 IOMMU 是否启用:

dmesg | grep -i iommu
# 应看到类似输出:
# DMAR: IOMMU enabled

步骤 2:屏蔽宿主机 GPU 驱动

echo "options vfio-pci ids=10de:13c2,10de:0fbb" | sudo tee /etc/modprobe.d/vfio.conf  # 替换 `ids` 为你的 GPU PCI ID(用 `lspci -nn | grep NVIDIA` 查)
echo "vfio-pci" | sudo tee /etc/modules-load.d/vfio-pci.conf
sudo update-initramfs -u
sudo reboot

验证 GPU 是否绑定到 vfio-pci

lspci -nnk -d 10de:
# 应显示 `Kernel driver in use: vfio-pci`

步骤 3:KVM 虚拟机配置 GPU 直通

使用 virt-manager 或 virsh 给虚拟机添加 PCI 设备:

virsh edit <vm-name>

添加:

<hostdev mode='subsystem' type='pci' managed='yes'><source><address domain='0x0000' bus='0x01' slot='0x00' function='0x0'/></source>
</hostdev>

(替换 bus/slot/function 为 lspci 查到的 GPU PCI 地址)


2. K8s 节点安装 NVIDIA 驱动

在 每个 K8s 节点(包括 KVM 虚拟机) 上安装 NVIDIA 驱动:

# Ubuntu/Debian
sudo apt install -y nvidia-driver-535 nvidia-dkms-535  # 替换为适合的驱动版本
sudo reboot# 验证
nvidia-smi

如果 nvidia-smi 无输出,检查:

  • KVM 直通是否成功(lspci -nnk | grep NVIDIA

  • 驱动是否正确安装(dkms status


3. K8s 集群安装 nvidia-device-plugin

方法 1:使用 Helm(推荐)

helm repo add nvidia https://helm.ngc.nvidia.com/nvidia
helm repo update
helm install --generate-name nvidia/nvidia-device-plugin

方法 2:直接部署 DaemonSet

kubectl create -f https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v0.14.1/nvidia-device-plugin.yml

检查是否正常运行:

kubectl get pods -n kube-system | grep nvidia
kubectl describe node <node-name> | grep nvidia.com/gpu

4. 在 Pod 中使用 GPU

在 Pod 的 resources.requests 中申请 GPU:

apiVersion: v1
kind: Pod
metadata:name: gpu-pod
spec:containers:- name: cuda-containerimage: nvidia/cuda:12.2.0-base-ubuntu22.04command: ["sleep", "infinity"]resources:limits:nvidia.com/gpu: 1  # 申请 1 个 GPU

部署并验证:

kubectl apply -f gpu-pod.yaml
kubectl exec -it gpu-pod -- nvidia-smi

5. 验证 K8s GPU 支持

检查节点 GPU 资源:

kubectl describe node <node-name> | grep -A 10 "Capacity"

输出应包含:

Capacity:nvidia.com/gpu:  1
Allocatable:nvidia.com/gpu:  1

常见问题

Q1: nvidia-device-plugin Pod CrashLoopBackOff

  • 检查 KVM 直通是否成功(nvidia-smi 是否能在虚拟机内运行)。

  • 检查 kubectl logs <nvidia-device-plugin-pod> 是否有错误。

Q2: Pod 无法调度(0/1 nodes are available: 1 Insufficient nvidia.com/gpu

  • 确认节点有 GPU(kubectl describe node)。

  • 检查 nvidia-device-plugin 是否正常运行。

Q3: KVM 虚拟机无法识别 GPU

  • 检查 lspci -nn | grep NVIDIA 是否显示 GPU。

  • 确保 vfio-pci 正确绑定(dmesg | grep vfio)。


总结

步骤操作
1. KVM GPU 直通启用 IOMMU + vfio-pci
2. 节点安装驱动nvidia-driver + nvidia-smi 验证
3. K8s 安装插件nvidia-device-plugin
4. Pod 申请 GPUresources.limits: nvidia.com/gpu: 1

如果你的 KVM 虚拟机成功识别 GPU,并且 K8s 节点能运行 nvidia-smi,那么 K8s 集群就可以调度 GPU 任务!

http://www.dtcms.com/wzjs/234396.html

相关文章:

  • 做质粒图谱的网站口碑营销ppt
  • 千库网ppt模板关键词怎样做优化排名
  • Wordpress 充值 卡密免费seo网站的工具
  • 如何做直播类网站百度账号一键登录
  • 广东网站建设费用设计培训学院
  • 上海那家公司做响应式网站建设app推广注册招代理
  • lng企业自建站网站提交入口链接
  • 南通网络科技的公司网站网站营销推广
  • 网站建设公司发展规划百度大数据
  • 网站脑图用什么做宁波seo软件免费课程
  • 公司网站的备案号是如何链接的石家庄网络营销
  • 辽宁省城乡建设网站百度联盟项目看广告挣钱
  • 深圳市坪山新区建设局网站营销推广策划及渠道
  • 做收费视频网站seo优化网站词
  • 哪些网站可以做文字链广告seo推广软件
  • 昆山网站建设 技术支持 力得网络推广app赚钱项目
  • 网站首页设计教程比较好的友链平台
  • 百度站长平台清退温州云优化seo
  • 青岛市建设工程质量安全监督站官方网站晚上必备免费软件大全苹果
  • 网站建设需要注意什么问题搜索引擎外部链接优化
  • 寻找做网站的合作伙伴北京独立站seo是什么意思
  • 建设科技信息 网站建设优化营商环境建议
  • 做网站用的浏览器有哪些临沂百度代理公司有几个
  • 南宁网站建设优化排名大数据智能营销
  • 试客网站 源码网页制作软件有哪些
  • 普通网站建设网络营销的缺点及建议
  • 莱芜网络推广seo算法
  • seo网站是什么网络营销常见的工具
  • wordpress首页显示摘要 插件seo在线优化技术
  • 零基础学编程宁波百度seo排名优化