【运维架构】云计算运维架构师与基础设施,技术路线,Linux证书(标准化/定制化/CNCF,公有云/混合云/私有云)
【运维架构】云计算运维架构师与基础设施,技术路线,Linux证书(标准化/定制化/CNCF,公有云/混合云)
文章目录
- 1、公有云-云资源提供商CSP(AWS/Azure/GCP/Cloudflare)
- 2、规范化-云原生基金会CNCF(CKA/CKS)& 技术架构师的定位
- 3、混合云-开源基础设施解决方案RedHat(RHCA/RHCE)
1、公有云-云资源提供商CSP(AWS/Azure/GCP/Cloudflare)
CSP(云服务提供商)属于第三方公司,提供可扩缩的计算资源,供企业通过网络按需访问,这些资源包括云端计算、存储、平台、和应用服务。
两种不同类型的云服务提供商
- AWS(Amazon Web Services)是全球最大的公有云厂商,占全球云市场约 33%,许多企业级应用依赖AWS。
AWS 托管了大量后端服务(如Netflix、Airbnb的后台)
业务逻辑运行在 AWS EC2 或 Lambda。 数据库用 AWS RDS,通过 Cloudflare Tunnel 安全暴露内网服务。 - Cloudflare 作为CDN和安全龙头,托管了互联网约20%的网站流量(因其免费计划普及率高),但不托管业务逻辑。
Cloudflare 保护并加速了海量前端流量(如Discord、Zoom的API)。
域名解析用 Cloudflare DNS。 静态资源托管在 AWS S3,通过 Cloudflare CDN 加速。Cloudflare WAF 过滤恶意请求。 - 两者常结合使用:例如用AWS运行后端,用Cloudflare加速和安全防护
参考资料:1, 2
2、规范化-云原生基金会CNCF(CKA/CKS)& 技术架构师的定位
云原生基金会CNCF扮演的角色
-
公有云CSP做标准化服务,IBM/Redhat做定制化服务(混合云,软件咨询),本质都是提供基础设施,中间的桥梁是开源的云原生基金会CNCF
-
三者关系:CNCF 推动技术标准化 -> Red Hat 将其产品化(定制化服务) -> CSP 提供托管环境(标准化服务)。
CSP 是资源提供方,CNCF 是技术标准制定者,Red Hat 是开源与企业需求的桥梁。
CSP卖“水电煤”,IBM/Red Hat卖“水管和净水器”(工具链+服务),CNCF制定水电煤和水管净水器的标准和规范。 -
CNCF将 云服务提供商 和 开源商业化 链接起来
CSP 是 CNCF 的主要贡献者和使用者(如AWS推出EKS,Azure提供AKS,均基于Kubernetes)
CSP 将 CNCF 项目集成到其服务中(如阿里云托管Prometheus服务)
Red Hat 是 CNCF 创始成员,主导 OpenShift(K8s发行版)和 Operator Framework 等关键项目
Red Hat 产品(如OpenShift)可在AWS/Azure上运行,提供混合云解决方案
分类 | 云服务提供商(CSP) | 云原生计算基金会(CNCF) | Red Hat(开源商业化) |
---|---|---|---|
代表厂商 | AWS、Azure、Google Cloud、阿里云 | 隶属Linux基金会,成员包括Google、AWS、Red Hat等 | IBM子公司,开源企业化领导者 |
核心定位 | 提供云计算基础设施和托管服务 | 推动云原生技术标准化与生态发展 | 将开源技术转化为企业级产品和服务 |
关键技术/服务 | 虚拟机、存储、数据库、Serverless | Kubernetes、Prometheus、Envoy等 | OpenShift、RHEL、Ansible |
商业模式 | 按需的云资源订阅 | 中立非营利,通过成员赞助和社区贡献 | 开源软件订阅制(支持+安全更新) |
典型用户场景 | 部署应用、托管数据、运行AI训练 | 构建云原生应用、统一技术标准 | 企业混合云、自动化运维、安全合规 |
云原生时代-通用型架构师的养成
-
“架构师”是更接近后端开发还是云计算运维呢?
“架构师”的定位因领域和公司需求而异,但总体上 既不完全等同于后端开发,也不仅限于云计算运维,而是横跨两者并向上延伸的角色。
架构师是技术深广度与业务理解的结合体,后端和云计算运维是两条常见起点。中小公司 更倾向全栈型架构师,大厂 则细分领域(如中间件架构师、云架构师)
终极目标是 用合理的技术方案支撑业务增长,而非局限于某一技术栈。根据当前角色选择一个垂直领域深入(如云原生),再逐步横向扩展,最终形成T型能力结构。 -
架构师的工作
无论何种方向,架构师的核心都是 设计可扩展、高可用、安全的系统,并平衡技术选型与业务需求。
技术决策:选择数据库、中间件、通信协议等。
系统拆分:微服务 vs 单体架构、服务边界划分。
非功能性需求:性能(QPS/延迟)、容灾(SLA/RTO)、成本控制。
跨团队协作:对齐开发、运维、产品团队的技术目标。 -
后端开发延伸的架构师:
设计DDD(领域驱动)的微服务划分
优化JVM参数
数据库分库分表(如ShardingSphere)
设计可观测性方案(Logging/Metrics/Tracing)。
案例:为社交App设计消息推送的分布式事务方案。
示例:负责电商平台订单/支付系统架构,要求精通Spring Cloud Alibaba、MySQL分片、Redis高可用。
发展:
1.突破单服务思维,学习分布式系统(CAP定理、一致性哈希)
2.掌握云原生技术(如K8s部署Spring Boot应用)
3.补充运维视角:监控(APM)、限流熔断(Sentinel) -
云计算/运维延伸的架构师:
设计多云架构(AWS + 私有OpenShift)。
实现GitOps(ArgoCD)和Service Mesh(Istio)。
通过容器化(Docker)和K8s声明式部署简化开发流程。
案例:为金融系统设计两地三中心容灾方案。
示例:设计AWS/GCP云原生方案,熟悉EKS/ACK、Serverless、成本优化工具(如Spot Instances)。
示例:主导从0到1的云原生中台建设,需同时具备开发(Go/Python)和运维(K8s/Ansible)经验
发展:
1.理解业务逻辑(如库存扣减的并发问题)
2.学习开发框架(至少一门语言如Go/Java)
3.深入架构模式:CQRS、Event Sourcing等
通用型架构师的养成
维度 | 后端架构师 | 云计算/运维架构师 | 通用型架构师 |
---|---|---|---|
主要领域 | 业务系统设计(如电商交易链路) | 基础设施与云平台(如K8s集群设计) | 全栈视角(前后端+云) |
技术栈 | 编程语言(Java/Go)、框架(Spring)、数据库优化 | IaC(Terraform)、K8s、监控(Prometheus) | 混合技术栈,关注系统集成 |
典型问题 | 如何降低订单系统延迟? | 如何设计跨可用区容灾方案? | 如何平衡技术债务与迭代速度? |
协作对象 | 开发团队、产品经理 | SRE、网络工程师 | CTO、业务部门 |
参考资料:CNCF官方项目列表, Red Hat 混合云方案
3、混合云-开源基础设施解决方案RedHat(RHCA/RHCE)
RedHat
-
Red Hat(红帽) 是一家以 企业级 Linux 和开源软件服务 为核心的公司,成立于1993年,2019年被IBM以340亿美刀收购。
-
核心业务:
提供 商业化的 Linux 发行版(RHEL, CentOS, Fedora)、云计算解决方案(OpenShift, Ansible)、企业支持服务。 -
Linux 商业化主流:Red Hat 是企业市场占有率最高的(约80%)。
其他商业化 Linux 厂商包括 Canonical (Ubuntu Server LTS)、Oracle Linux(RHEL 兼容版)、SUSE Linux Enterprise (SLE)等等。 -
Red Hat 的 其他开源基础设施:
从操作系统到云原生技术的全栈解决方案,核心围绕 企业级稳定性、安全性和自动化 设计。
所有功能先贡献给开源社区(如Kubernetes、Linux内核),再打包为企业版。
客户获得:安全补丁、法律保障(如专利保护)、技术支持(24/7 SLA)。从操作系统(RHEL)到应用平台(OpenShift)全栈可控,避免供应商锁定。 -
Red Hat 与KVM的关系(开源项目之一)
KVM 是 Linux 内核的原生虚拟化模块,由社区开发并维护,不属于 Red Hat 所有,但 Red Hat 是其核心贡献者之一。
技术原理:通过将 Linux 内核转变为 Hypervisor,实现硬件虚拟化(需 CPU 支持 VT-x/AMD-V)。
RHEL 的默认虚拟化方案:从 RHEL 6 开始,Red Hat 将 KVM 作为官方支持的虚拟化技术(替代早期的 Xen) -
优势:
快速响应漏洞(如Log4j事件中早于社区发布补丁) -
Red Hat 的业务模式 vs 甲骨文(Oracle)
相同点:均面向企业客户,提供 高可靠性服务 和 长期支持,通过 商业软件+订阅制 盈利(而非单纯卖许可证)。
不同点:Red Hat 专注 开源基础设施,Oracle 侧重 数据库和商业软件。
IBM
-
硬件业务(25%):
IBM Z系列大型机:全球银行/航空业核心系统(如每秒处理2.4亿笔交易的z16芯片)
Power Systems:基于Power处理器的AI优化服务器(如Linux on Power)
存储解决方案:FlashSystem全闪存存储(与公有云集成)
硬件销售+维护服务(非单纯托管),客户多为金融、政府等关键领域
与云协同:例如IBM Cloud中提供“Z as a Service”
营收占比下降但仍盈利(2023年占25%),被归为“传统基础设施”板块。 -
软件业务(42%)
Red Hat:OpenShift订阅制收入年增长20%+,成为混合云事实标准
自动化软件:如Instana(AI运维)、Turbonomic(资源优化) -
咨询业务(33%)
企业数字化转型:帮助客户落地AI、区块链(如沃尔玛供应链改造)。
与软件绑定:75%的软件客户同时采购咨询服务。 -
核心竞争力
1.企业级复杂需求的理解(如银行核心系统改造)。
2.开源与闭源的平衡能力(Red Hat+IBM专利组合)。
3.从实验室到落地的全链条覆盖(量子研发->云服务->咨询部署)。
业务领域 | 营收占比 | 代表产品/服务 | 定位与战略意义 |
---|---|---|---|
软件 | 42% | Red Hat, Watsonx, Cloud Paks, Db2 | 增长引擎,利润率最高(混合云+AI驱动) |
咨询 | 31% | IBM Consulting (数字化转型、AI落地) | 高粘性服务,绑定企业长期需求 |
基础设施 | 25% | IBM Z大型机、Power Systems, 存储 | 传统现金牛,但增长放缓 |
前沿科技与量子 | <2% | IBM Quantum, 半导体研发(如2nm芯片) | 长期技术壁垒,品牌溢价来源 |
Linux
- 认证体系:
RHCSA/RHCE | Red Hat | 企业运维核心认证
LPIC | Linux基金会 | 通用Linux认证
CKA/CKAD | CNCF | Kubernetes 运维认证
Ubuntu认证 | Canonical | 云和 DevOps 方向 - 运维=Linux运维,运维证书=Linux证书
- 初级阶段:
掌握基础命令:ls, grep, awk, sed, systemd
学习 Shell 脚本:变量、循环、条件判断
理解文件权限:chmod, chown, SELinux/AppArmor - 中级阶段:
服务管理:Apache/Nginx, MySQL, Docker
网络配置:ip, netstat, iptables/firewalld
自动化工具:Ansible(Red Hat 旗下)、Terraform - 高级阶段:
集群运维:Kubernetes(OpenShift)、Ceph(分布式存储)
性能调优:perf, strace, 内核参数优化
安全加固:漏洞扫描(OpenSCAP)、审计(Auditd)
参考资料:1