当前位置: 首页 > news >正文

【每天一个知识点】云存储(Cloud Storage)

云存储技术要点(技术视角)

1) 定义与定位

  • 对象 / 块 / 文件为抽象的数据服务,运行在公有云、私有云或混合云上,通过 API/协议对外提供弹性容量、按需计费、高可用与多副本/纠删码容灾能力。

  • 与计算解耦,通过标准接口(S3、NFS/SMB、iSCSI/NVMe-oF)对接应用与平台(容器云、数据湖、备份归档、AI训练等)。

2) 服务类型与典型协议

  • 对象存储(Object):S3/Swift API,面向非结构化海量小~大文件;天然扁平命名空间、强/最终一致性可配置,支持生命周期/版本控制/分层存储(热温冷归档)。

  • 块存储(Block):面向数据库/虚机磁盘;协议 iSCSI、FC、NVMe-oF;追求低时延与高 IOPS;常做快照/克隆、写时复制。

  • 文件存储(File/NAS):POSIX/半 POSIX 访问;协议 NFS/SMB;适合企业共享目录、媒体处理、传统应用迁移。

  • 归档存储(Archive):极低成本、分钟~小时级取回延迟;适合长期合规留存。

3) 关键技术设计

  • 持久性/可用性:多副本(×3)或纠删码 EC(k+m)(如 8+3、10+4)跨故障域/机架/机房/地域;EC 提升存储效率,代价是重建算力与网络放大。

  • 一致性模型:对象多见读取后写入一致(Read-after-Write)或可选最终一致;块/文件通常需强一致(分布式锁/仲裁)。

  • 多租户与隔离:基于租户/账号/桶(bucket)与 IAM/STS 临时密钥;配合策略引擎(Bucket Policy、ACL、RBAC)

  • 数据保护:版本控制、跨区域复制(CRR)、WORM/对象锁、加密(At-Rest:KMS/自管密钥;In-Transit:TLS)。

  • 性能路径:热数据走本地或 NVMe 缓存层,冷数据走高密 HDD;多队列 + 零拷贝 + 大对象多段并行(Multipart)

  • 元数据与目录服务:对象存储常将数据/元数据分离,元数据走强一致 KV/数据库(如 RocksDB/etcd/自研),目录列举做前缀索引与分页游标。

  • 可观测性:指标(容量、IOPS、带宽、P95/P99 时延)、审计日志、访问日志(S3 Access Log)、事件通知(Webhook/Kafka)。

4) 典型实现与生态对接

  • 私有/行业云栈:Ceph(RADOS + RGW/RBD/CephFS)、MinIO(高性能对象)、OpenStack Swift、JuiceFS(云对象+客户端元数据)、GlusterFS 等。

  • 容器与大数据

    • K8s:CSI(块/文件)与 COSI(对象,生态在发展),Operator 管理集群与自动扩容。

    • 数据湖/AI:对象存储对接 Hudi/Iceberg/Delta,训练/推理用 S3A/OSS 直读或本地缓存。

  • 数据搬迁/分层:同城/跨域复制、分层策略(热→温→冷→归档),网关或调度器(如 Data Lifecycle Manager)。

5) 性能与容量规划要点

  • 工作负载画像:对象大小分布、读写比、并发度、峰值/均值带宽、SLA(P95 时延)。

  • 编码与副本:冷热分层:热数据副本,温/冷数据 EC(8+3/10+4);确保重建带宽≥单盘吞吐 × 盘数,以降低重建窗口。

  • 网络:东西向重建/复制流量充足(10/25/40/100 GbE);前端南北向带宽与多路径;ToR/汇聚拥塞管理(ECN/PFC)。

  • 扩展性:去中心化元数据、水平扩展存储池、一致性哈希/CRUSH 负载均衡。

6) 安全与合规

  • 加密:KMS CMK/自带 KMS;对象级 SSE-KMS / SSE-C;卷级 LUKS/硬件加密。

  • 访问控制:细粒度策略(路径前缀、IP、VPC 端点);私有端点避免公网。

  • 合规:WORM(对象锁)、保留期、审计追踪,满足等保/ISO/金融监管等。

7) 参考架构(ASCII 简图)

[应用/平台] ──> S3 / NFS / SMB / iSCSI / NVMe-oF│
[API 网关/负载均衡/多活入口]│
[对象网关(RGW/MinIO) | 文件头结点(NAS) | 块网关(CSI/Target)]│
[元数据服务(强一致KV/DB) ]  [身份鉴权/策略(IAM/KMS/STS)]│
[存储集群: NVMe 缓存层 + HDD 容量层]│
[纠删码/副本  跨机架/跨AZ  背景重建/再均衡]│
[监控(A|M|T) 审计/日志  生命周期/复制/归档]

8) 常见优化清单(落地实操)

  • 对象上传:Multipart 64–128 MB 分片,并发 ≥ CPU 核数×2,开启 CRC/MD5 校验。

  • 小文件聚合:客户端打包/合并或使用 Parquet/ORC;网关端启用小对象合并池。

  • 列举优化:前缀分桶、合理分隔符、分页游标;避免深目录模拟。

  • 块存储:对数据库类启用直通/预留 IOPS卷;禁用写缓存回写导致的抖动。

  • 文件存储:NFSv4 + 多会话并行;元数据密集型场景考虑 元数据集群水平扩展。

http://www.dtcms.com/a/355568.html

相关文章:

  • 从混沌到有序:工作流设计的创作迷思与破局之道
  • AI智能农业监测系统深度解读:从大田作物管理到病虫害预警,破解传统农业增产难题
  • 大模型私有化部署
  • RAG概念被误用:AI应用落地需回归上下文工程本质
  • leetcode算法day22
  • kotlin中关于协程的使用
  • 陕西风味马卡龙:家常自制,特色甜趣共享
  • 传输层协议介绍
  • 结构化提示词革命:JSON Prompting如何让AI输出精准如激光
  • 数字化生产管理系统 (MES)
  • 服务器核心组件:CPU 与 GPU 的核心区别、应用场景、协同工作
  • 揭开.NET Core 中 ToList () 与 ToArray () 的面纱:从原理到抉择
  • ansible常用命令的简单练习
  • Linux系统 -- 多线程的控制(互斥与同步)
  • 数学思维好题(冯哈伯公式)-平方根下取整求和
  • 个人博客运行3个月记录
  • 了解ADS中信号和电源完整性的S参数因果关系
  • Typora 教程:从零开始掌握 Markdown 高效写作
  • MySQL事务ACID特性
  • JavaScript中的BOM,DOM和事件
  • 英语单词:ad-hoc
  • BugKu Web渗透之成绩查询
  • 白杨SEO:网站优化怎么做?应用举例和适合哪些企业做?参考
  • 速成Javascript(二)
  • 新书速览|SQL Server运维之道
  • 【第三方网站运行环境测试:服务器配置(如Nginx/Apache)的WEB安全测试重点】
  • 激活函数篇(3):Softmax
  • maven scope 详解
  • 通信原理实验之线性均衡器-迫零算法
  • dht11传感器总结