运维命令基础
运维命令
Kubernetes 运维基础命令技术文章大纲
Kubernetes 集群基本信息查看
使用 kubectl cluster-info
查看集群基本信息,包括主节点地址和运行的服务。
kubectl version
查看客户端和服务器版本信息。
kubectl get nodes
列出集群中的所有节点及其状态。
资源管理命令
kubectl get pods -A
查看所有命名空间的 Pod 状态。
kubectl describe pod <pod-name> -n <namespace>
查看特定 Pod 的详细信息。
kubectl logs <pod-name> -n <namespace>
查看 Pod 的日志。
部署与更新应用
kubectl apply -f <manifest-file.yaml>
部署或更新资源。
kubectl rollout status deployment/<deployment-name>
查看部署状态。
kubectl scale deployment <deployment-name> --replicas=3
调整副本数量。
故障排查与调试
kubectl exec -it <pod-name> -n <namespace> -- /bin/bash
进入 Pod 的 Shell。
kubectl top pods -n <namespace>
查看 Pod 的资源使用情况。
kubectl get events -A
查看集群事件,排查异常情况。
配置管理与密钥操作
kubectl get configmaps -n <namespace>
查看 ConfigMap 列表。
kubectl get secrets -n <namespace>
查看 Secret 列表。
kubectl edit secret <secret-name> -n <namespace>
编辑 Secret 配置。
网络与服务管理
kubectl get services -A
查看所有服务。
kubectl get ingress -A
查看 Ingress 资源。
kubectl port-forward <pod-name> <local-port>:<pod-port>
端口转发调试。
备份与恢复
kubectl get all -A -o yaml > backup.yaml
导出所有资源为 YAML 文件。
velero backup create <backup-name>
(如使用 Velero)创建集群备份。
kubectl replace -f <backup-file.yaml>
恢复资源配置。
节点维护与升级
kubectl drain <node-name> --ignore-daemonsets
清空节点以进行维护。
kubectl uncordon <node-name>
恢复节点调度。
kubectl get cs
检查控制平面组件状态。
安全与权限管理
kubectl get roles -A
查看集群角色。
kubectl get serviceaccounts -A
查看服务账户。
kubectl auth can-i <verb> <resource>
检查当前用户权限。
扩展与自定义资源
kubectl get crd
查看自定义资源定义(CRD)。
kubectl api-resources
列出所有支持的 API 资源。
kubectl explain <resource>
查看资源字段说明。
Docker运维基础命令
基础概念与安装
- Docker简介与核心组件(镜像、容器、仓库)
- Docker的安装与配置(Linux/Windows/macOS)
- 验证安装与版本检查命令
镜像管理命令
- 拉取镜像:
docker pull
- 查看本地镜像列表:
docker images
- 删除镜像:
docker rmi
- 镜像标签与导出:
docker tag
、docker save
- 构建镜像:
docker build
与Dockerfile简介
容器操作命令
- 启动容器:
docker run
及其常用参数(-d, -p, -v) - 查看运行中的容器:
docker ps
- 停止/启动/重启容器:
docker stop/start/restart
- 进入容器终端:
docker exec -it
- 删除容器:
docker rm
- 查看容器日志:
docker logs
网络与存储管理
- 创建自定义网络:
docker network create
- 查看网络列表:
docker network ls
- 数据卷操作:
docker volume create/inspect
- 挂载主机目录:
-v
参数的使用
系统与资源监控
- 查看Docker系统信息:
docker info
- 监控容器资源占用:
docker stats
- 清理无用资源:
docker system prune
常用组合命令示例
- 批量停止/删除容器
- 备份与恢复容器数据
- 调试容器内部服务的技巧
安全与最佳实践
- 非root用户操作Docker
- 容器权限控制(–cap-drop)
- 镜像安全扫描建议
Linux运维基础命令
文件与目录管理
ls
:列出目录内容cd
:切换目录pwd
:显示当前路径mkdir
/rmdir
:创建/删除目录cp
/mv
/rm
:复制/移动/删除文件或目录
文件内容查看与编辑
cat
:查看文件内容more
/less
:分页查看文件head
/tail
:查看文件开头/结尾grep
:文本搜索工具vim
/nano
:文本编辑器
权限与用户管理
chmod
:修改文件权限chown
/chgrp
:修改文件所有者/组useradd
/userdel
:用户管理passwd
:修改用户密码
系统信息与进程管理
uname
:查看系统信息top
/htop
:实时监控系统资源ps
:查看进程状态kill
/pkill
:终止进程
网络管理
ifconfig
/ip
:网络接口配置ping
/traceroute
:网络连通性测试netstat
/ss
:网络连接状态curl
/wget
:下载工具
磁盘与存储管理
df
/du
:查看磁盘使用情况fdisk
/parted
:磁盘分区工具mount
/umount
:挂载/卸载文件系统
包管理与服务控制
apt
/yum
/dnf
:包管理工具systemctl
:服务管理(启动/停止/重启)journalctl
:查看系统日志
脚本与自动化
crontab
:定时任务管理bash
脚本基础语法- 常用运维脚本示例
安全与备份
ssh
:远程登录工具scp
/rsync
:文件传输与同步tar
/gzip
:文件压缩与解压
总结与进阶建议
- 常用命令组合与技巧
- 推荐学习资源(书籍、在线课程)
- 运维工具扩展(Ansible/Docker等)