当前位置: 首页 > news >正文

《信息存储与管理》完整复习手册

说明

本手册涵盖课程13章核心知识点、高频计算考点及每章PPT课后选择题(含答案+详细解析),重点标注高频考点及计算公式,助力高效复习。

第一章 绪论

一、核心知识点

  1. 数据与信息

    1. 数据:未经处理的事实集合(如原始日志);信息:从数据中派生的知识(如用户行为分析报告)。

    2. 数据类型:结构化数据(数据库表,占10%)、非结构化数据(视频/邮件/图片,占90%)。

  2. 数据中心核心元素(5个):应用程序、数据库管理系统(DBMS,如MySQL/Oracle)、主机(计算)、网络、存储。

  3. 存储核心目标:高性能(吞吐率高、延迟低)、高可靠性(数据不丢失)、高可用性(服务不中断)。

  4. 关键技术概念

    1. 虚拟化:抽象物理资源为逻辑资源(如Docker容器、VMware虚拟机),提高资源利用率。

    2. 云计算:按需使用IT资源(如阿里云),特征:自助服务、资源共用、可计量、快速扩展。

二、计算考点

三、课后选择题(含答案+解析)

  1. 以下哪一项是结构化数据的示例?A. 映像 B. PDF文档 C. 数据库 D. 网页答案:C解析:结构化数据以行列结构存储,数据库(如MySQL表)是典型;A/B/D均为非结构化数据。

  2. 关于大数据,以下哪项是正确的?A. 仅包括非结构化数据 B. 包括来自单个源的数据 C. 使用传统软件工具高效捕获 D. 数据大小超出传统软件的处理能力答案:D解析:大数据定义为“超出常用软件工具处理能力的数据集”,含结构化+非结构化数据(A错),来自多源(B错),传统工具无法高效处理(C错)。

  3. 以下哪一项是以信息为中心的体系结构的功能?A. 内置于服务器之中的存储 B. 防止在服务器之间共享存储 C. 单个系统中包括服务器、网络和存储 D. 存储将得到集中管理且独立于服务器答案:D解析:信息为中心的体系结构(如SAN/NAS)核心是存储独立于服务器、集中管理;A是DAS特征,B与共享理念矛盾,C是超融合架构(HCI)特征。

  4. 以下哪一项准确描述了虚拟化?A. 提供按需计量服务 B. 将物理资源抽象化为逻辑资源 C. 共用逻辑资源以提供数据完整性 D. 支持跨数据中心的分散式管理答案:B解析:虚拟化的核心是“物理→逻辑抽象”(如1台物理机拆为3台VM);A是云计算特征,C/D与虚拟化定义无关。

  5. 以下哪项要求是指存储解决方案能够随业务一同增长?A. 可用性 B. 可管理性 C. 完整性 D. 可扩展性答案:D解析:可扩展性指存储容量/性能随业务需求增长而扩展;A是服务不中断,B是易管理,C是数据不篡改。

第二章 数据中心环境

一、核心知识点

  1. 应用程序I/O特性

    1. 读写类型:读取密集型(如报表系统)、写入密集型(如短视频APP)。

    2. I/O模式:按序(如视频播放)、随机(如数据库查询);I/O大小(4KB/64KB等)。

  2. 主机组件

    1. 硬件:CPU、内存(支持虚拟化,交换空间=磁盘模拟内存)。

    2. 软件:OS(如Linux)、LVM(逻辑卷管理,将多个物理卷→卷组→逻辑卷,支持分区/合并)、文件系统(日志型如EXT4,原子性事务保障数据完整)。

  3. 连接协议参数

    协议

    版本

    带宽

    速度

    最大长度

    适用场景

    SATA

    3.0

    6Gb/s

    600MB/s

    2米

    普通PC硬盘

    SAS

    4.0

    24Gb/s

    -

    10米

    服务器硬盘

    PCIe

    4.0 x16

    32GB/s

    -

    -

    显卡/高速设备

    1. 存储设备:磁带(低成本归档)、光盘(小容量分发)、HDD(机械盘,随机访问)、SSD(闪存,无机械延迟,高性能)。

    2. 直连存储(DAS:主机直接连存储,部署简单、成本低,但可扩展性差(端口有限)。

    二、计算考点(高频)

    1. 磁盘服务时间计算

      1. 公式:**磁盘服务时间 = 寻道时间 + 旋转延迟 + 数据传输时间**

        • 旋转延迟:(60/磁盘转速)/ 2(平均旋转半周),如15000rpm硬盘:(60/15000)/2 = 2ms。

        • 传输时间:数据块大小 / 数据传输速度,如4KB数据、40MB/s传输速度:4KB / 40MB/s ≈ 0.1ms。

      2. 示例:15000rpm硬盘(寻道5ms、传输40MB/s)处理4KB数据,服务时间=5+2+0.1≈7.1ms。

    2. 所需磁盘数量计算(需同时满足容量和性能需求)

      1. 容量需求磁盘数(Dc):总容量需求 / 单盘容量。

      2. 性能需求磁盘数(Dp):峰值IOPS /(单盘IOPS × 0.7)(性能敏感型应用利用率≤70%)。

      3. 最终磁盘数:**max(Dc, Dp)**

      4. 示例:容量需求1.46TiB,单盘146GiB→Dc=10;峰值IOPS 9000,单盘IOPS 180→Dp=9000/(180×0.7)≈72→最终72盘。

    三、课后选择题(含答案+解析)

    1. 以下哪一项是计算虚拟化的好处?A. 支持计算内存交换 B. 提高计算利用率 C. 将计算内存与应用程序隔离 D. 将计算OS与应用程序隔离答案:B解析:计算虚拟化(如VM)让1台物理机跑多台VM,资源利用率从30%→80%;A是内存虚拟化功能,C/D与虚拟化核心好处无关。

    2. 哪一项是对虚拟机VM)的最佳描述?A. 物理服务器上的所有虚拟机都必须运行同一OS B. 当虚拟机关闭时会删除虚拟机文件 C. 虚拟机是独立的文件组 D. 所有虚拟机平等共享可用资源答案:C解析:VM以文件形式存储(如.vmdk磁盘文件),是独立文件组;A可跑不同OS(如Windows+Linux),B关闭不删文件,D可按需分配资源(非平等)。

    3. 什么是合并?A. 将多个物理驱动器分组到逻辑驱动器 B. 将物理驱动器分为多个逻辑驱动器 C. 在逻辑驱动器上写入磁盘元数据的过程 D. 通过碎片整理向物理驱动器添加更多容量答案:A解析:合并是LVM功能,将多物理卷→卷组→逻辑卷(如2个500GB→1个1TB逻辑卷);B是分区,C/D与合并定义无关。

    4. 哪些因素决定机械磁盘的总体服务时间?A. 磁盘缓冲时间、全程和旋转延迟 B. 内部传输速度、外部传输速度和缓冲时间 C. 全程、平均寻道时间和道间寻道时间 D. 平均寻道时间、旋转延迟和数据传输时间答案:D解析:机械磁盘服务时间由“寻道(磁头移动)+旋转(盘片转动)+传输(数据读写)”三部分组成,对应选项D。

    5. 哪一项是DAS环境的挑战?A. 性能低 B. 可扩展性有限 C. 部署复杂性 D. 最初投资过多答案:B解析:DAS端口有限(如存储阵列只有4个SAS口),最多连4台主机,可扩展性差;A性能不低(适合单主机),C部署简单,D初始投资低。

    第三章 数据保护-RAID

    一、核心知识点

    1. RAID定义与目的:将多磁盘合并为逻辑单元,提供容错(防磁盘故障)和/或性能提升,解决单盘MTBF低的问题(如1000台盘MTBF=单盘MTBF/1000)。

    2. RAID实现方式

      1. 软件RAID:依赖主机CPU,支持RAID级别少,影响主机性能。

      2. 硬件RAID:专用RAID控制器(主机/阵列),独立处理RAID计算,支持全级别,性能好。

    3. RAID三大核心技术

      1. 分条(Striping):数据拆分为条带(固定大小),跨盘存储,并行读写→提升性能(RAID0核心)。

      2. 镜像(Mirroring):数据实时复制到另一磁盘,容错性强→RAID1核心,写入次数翻倍(1次写→2次)。

      3. 奇偶校验(Parity):XOR运算生成校验数据(D1⊕D2⊕D3=P),单盘故障可恢复→RAID3/5/6核心。

    4. 常用RAID级别对比(高频考点)

      RAID级别

      最少磁盘

      可用容量%

      读取性能

      写入性能

      容错能力

      适用场景

      0

      2

      100

      临时文件/非关键数据

      1

      2

      50

      差(2次写)

      单盘故障

      数据库日志/关键小数据

      10

      4

      50

      多盘故障(不同镜像)

      核心业务(OLTP/RDBMS)

      5

      3

      (n-1)/n×100

      中(4次写)

      单盘故障

      邮件/普通业务

      6

      4

      (n-2)/n×100

      差(6次写)

      双盘故障

      归档/不可中断业务

      二、计算考点(高频)

      1. RAID性能损失计算(IOPS负载)

        1. 核心逻辑:不同RAID级别“写1次=多IO操作”,负载=读IOPS + 写IOPS×写次数

          RAID级别

          写1次对应IO次数

          原因(读旧数据/旧校验+写新数据/新校验)

          1/10

          2

          镜像:写源盘+写镜像盘

          5

          4

          读旧数据+读旧校验→写新数据+写新校验

          6

          6

          读旧数据+读2个旧校验→写新数据+写2个新校验

          • 示例:高峰IOPS 1200,读写比2:1→读IOPS=800,写IOPS=400

            • RAID10负载:800 + 400×2 = 1600 IOPS

            • RAID5负载:800 + 400×4 = 2400 IOPS

        2. 分条大小计算(奇偶校验RAID,分条大小=条带大小×(磁盘数-校验盘数))

          1. 示例:RAID5(5盘,1校验盘),条带大小64KB→分条大小=64KB×(5-1)=256KB。

        三、课后选择题(含答案+解析)

        1. 关于软件RAID实现,以下哪项描述是正确的?A. 操作系统升级不需要验证与RAID软件的兼容性 B. 其成本高于硬件RAID实现 C. 支持所有RAID级别 D. 使用主机CPU周期执行RAID计算答案:D解析:软件RAID依赖主机CPU处理RAID运算(如XOR校验);A需验证兼容性,B成本低(无专用控制器),C仅支持基础级别(如RAID0/1)。

        2. 一个应用程序生成400个小型随机IOPS,读写比为3:1。用RAID 5的磁盘总负载IOPS是多少?A. 400 B. 500 C. 700 D. 900答案:C解析:读IOPS=400×3/4=300,写IOPS=100;RAID5写1次=4次IO→总负载=300 + 100×4=700。

        3. 用于小型随机I/O的RAID 6配置中的写性能损失是多少?A. 2 B. 3 C. 4 D. 6答案:D解析:RAID6写1次需“读旧数据+读2个旧校验+写新数据+写2个新校验”,共6次IO,写性能损失为6。

        4. 以下哪个应用程序可通过使用RAID 3获得最大效益?A. 备份 B. OLTP C. 电子商务 D. 电子邮件答案:A解析:RAID3是字节级分条+专用校验盘,适合大型顺序I/O(如备份数据连续读写);B/C/D是小型随机I/O,适合RAID5/10。

        5. 一个具有64 KB条带大小且包含五个磁盘的奇偶校验RAID 5集的分条大小是多少?A. 64 KB B. 128 KB C. 256 KB D. 320 KB答案:C解析:RAID5有1个校验盘,有效数据盘=5-1=4;分条大小=条带大小×有效盘数=64KB×4=256KB。

        第四章 智能存储系统

        一、核心知识点

        1. 智能存储系统(ISS)定义:功能丰富的RAID阵列,含缓存、多I/O路径,支持SSD、虚拟化调配,优化I/O处理。

        2. ISS核心组件

          1. 前端:连主机的接口(FC/iSCSI口)、控制器(处理I/O请求)。

          2. 缓存:临时存储热点数据,提升性能;核心机制:

            • 读操作:命中(直接返回)、未命中(读磁盘+存缓存),读命中率衡量性能。

            • 写操作:透写(先写磁盘再确认,安全)、回写(先确认再写磁盘,快,需防掉电)。

            • 管理算法:LRU(删久未访问)、MRU(删常访问);水位线(空闲刷新、高水位刷新、强制刷新)。

            • 数据保护:缓存镜像(双存储卡存数据)、缓存保管(掉电转储到专用盘)。

          3. 后端:连物理磁盘的接口、控制器,管理RAID。

        3. 存储资源调配

          1. 传统调配:LUN与物理磁盘绑定,容量固定(如分100GB,用不完也占资源)。

          2. 虚拟调配(精简配置):LUN显示大容量(如10TB),实际用多少分配多少(如初始3TB),提高资源利用率。

          3. LUN扩展:MetaLUN(合并:仅扩容量;分条:扩容量+性能)。

        4. ISS类型:高端(活动-活动,多路径I/O,适合大企业)、中端(活动-被动,单路径I/O,适合中小企业)。

        二、计算考点

        三、课后选择题(含答案+解析)

        1. 在传统存储资源调配中,哪个LUN扩展技术可改进性能?A. 合并metaLUN B. 分条metaLUN C. 基础LUN D. 组件LUN答案:B解析:分条metaLUN将多个LUN分条,并行读写→提升性能;合并仅扩容量,不提升性能。

        2. 哪个进程通过限制主机对特定LUN的访问来提供数据访问控制?A. LUN 掩蔽 B. 分区 C. 主动变更 D. VSAN答案:A解析:LUN掩蔽定义“主机可访问的LUN”,防止未授权访问;B是FC SAN的逻辑分组,D是虚拟SAN。

        3. 哪个机制提供对“缓存中的未提交数据”的电源故障保护?A. 镜像 B. 缓存保管 C. 水位线 D. 分层答案:B解析:缓存保管在掉电时将未提交数据转储到专用“保险存储驱动器”,电源恢复后恢复;A防缓存故障,C是缓存刷新策略,D是存储分层。

        第五章 光纤通道存储区域网(FC SAN)

        一、核心知识点

        1. FC SAN定义:服务器与共享存储的高速专用网络,数据块级共享,适合核心业务(如数据库)。

        2. FC SAN组件

          1. 节点端口:HBA卡(服务器)、前端适配器(存储),双工链路(Tx/Rx)。

          2. 缆线:铜缆(30米内)、光纤(单模:10km,长距;多模:短距,成本低)。

          3. 连接器:SC(方型,交换机)、LC(双工,小型)、ST(圆形,旧式)。

          4. 互连设备:集线器(FC-AL,共享带宽,最多126节点)、交换机(FC-SW,专用路径,可扩展)、导向器(高端交换机,冗余组件)。

        3. FC互连选项

          1. 点到点:直接连接,DAS用。

          2. FC-AL(仲裁环):共享环,1次1设备I/O,节点变动暂停通信。

          3. FC-SW(交换结构):交换机互连,专用路径,节点变动不影响。

        4. FC协议栈(5层)

          层级

          名称

          功能

          FC-4

          协议映射

          将SCSI/IP映射到FC(如FCP=SCSI over FC)

          FC-3

          通用服务

          未实施

          FC-2

          成帧/流控

          帧结构、FC寻址、流控(信用机制)

          FC-1

          编码/解码

          8b/10b(旧)、64b/66b(新)编码

          FC-0

          物理层

          介质、缆线、连接器

          1. FC寻址

            1. FC地址:24位,含域ID(交换机唯一,239个)、区域ID(256个)、端口ID(256个)→总设备数≈1500万。

            2. WWN(全球通用名):64位唯一标识,WWNN(节点)、WWPN(端口),类似MAC地址。

          2. 分区:逻辑分组节点,限制RSCN通信(减少广播风暴)、提供访问控制;类型:WWN分区(按设备WWN)、端口分区(按交换机端口)、混合分区。

          二、计算考点

          三、课后选择题(含答案+解析)

          1. 哪种缆线可在远距离时提供最小的信号衰减?A. 双绞铜线 B. 同轴铜线 C. 单模光纤 D. 多模光纤答案:C解析:单模光纤仅传1条光束,信号衰减最小,支持10km+;多模传多光束,短距衰减小,长距衰减大;铜线衰减大,短距用。

          2. 什么是FC SAN 中的F_Port?A. 连接E_Port 的交换机端口 B. 连接N_Port 的交换机端口 C. 连接N_Port 的节点端口 D. 连接E_Port 的节点端口答案:B解析:FC端口定义:N_Port(节点端口,服务器/存储)、F_Port(交换机端口,连N_Port)、E_Port(交换机端口,连其他交换机,ISL链路)。

          3. 哪种类型的连接结构登录支持在N_Port 之间交换与上层协议相关的参数?A. 连接结构登录 B. 端口登录 C. 进程登录 D. ULP 登录答案:C解析:登录类型:FLOGI(N→F,获FC地址)、PLOGI(N→N,建立会话)、PRLI(N→N,交换ULP参数,如SCSI协议参数)。

          4. FC SAN 中分区的优点有哪些?A. 共享连接结构服务 B. 限制RSCN 通信 C. 支持在线卷扩展 D. 提供无中断数据迁移答案:B解析:分区将节点分组,仅组内通信,限制RSCN(状态变更通知)广播范围;A/C/D与分区功能无关。

          5. VSAN 的优点是什么?A. 不再需要连接结构登录进程 B. 提供的网络带宽更高 C. 通过分隔VSAN 之间的通信提高安全性 D. 使VSAN 能够共享连接结构分区服务答案:C解析:VSAN是FC SAN上的逻辑结构,各VSAN独立(服务/配置/地址),分隔通信→提高安全性;A仍需登录,B带宽不变,D不共享分区服务。

          第六章 IP SAN和FCoE

          一、核心知识点

          1. IP SAN定义:基于IP网络传输数据块,核心协议iSCSI(SCSI over IP)、FCIP(FC over IP),成本低(复用现有IP网络)。

          2. iSCSI核心组件

            1. 启动器(Initiator):服务器端,如iSCSI HBA卡(卸载CPU)、TOE NIC(卸载TCP)、软件启动器(依赖CPU)。

            2. 目标(Target):存储端,如iSCSI端口、iSCSI网关(连FC存储)。

            3. 拓扑:本机iSCSI(直连存储)、桥接iSCSI(iSCSI网关连FC存储)。

          3. iSCSI关键技术

            1. 协议栈:应用层(SCSI)→会话层(iSCSI)→传输层(TCP)→网络层(IP)→数据链路层(以太网)。

            2. 发现:SendTargets(手动配目标IP)、iSNS(注册到服务器,自动发现)。

            3. 名称:iqn(需注册域名,如iqn.2024-nwpu:storage1)、eui(IEEE EUI-64,如eui.0300732A32598D26)。

          4. FCIP协议:FC帧封装到IP包,连接分布式FC SAN(如北京-上海灾备),提供长距传输。

          5. FCoE(以太网光纤通道)

            1. 定义:FC帧封装到以太网帧,整合FC和以太网(1张CNA卡+1条线),降成本、简化管理。

            2. 组件:CNA卡(整合NIC+FC HBA)、FCoE交换机(含FCF转发器,封装/解封装FC帧)、CEE(聚合增强以太网,无损耗)。

            3. CEE核心功能:PFC(基于优先级流控,独立暂停虚拟链路)、ETS(带宽分配)、CN(拥挤通知)、DCBX(配置同步)。

          二、计算考点

          三、课后选择题(含答案+解析)

          1. 哪个iSCSI 主机连接选项可从主机CPU 分流iSCSI 和TCP/IP 处理的负载?A. 具有iSCSI 启动器软件的标准NIC B. TOE NIC C. iSCSI HBA D. CNA答案:C解析:iSCSI HBA卡同时卸载iSCSI和TCP/IP处理;A依赖CPU,B仅卸载TCP,D是FCoE组件。

          2. 哪种类型的iSCSI 名称需要注册域名才能生成唯一iSCSI 标识符?A. eui B. iqn C. WWN D. MAC答案:B解析:iqn格式为“iqn.年份-机构域名:自定义”,需注册域名(如nwpu.edu.cn);eui基于IEEE EUI-64,无需注册。

          3. 哪个协议可将FC 帧封装到IP 数据包?A. FCoE B. iSCSI C. FCIP D. CIFS答案:C解析:FCIP是“FC over IP”,封装FC帧到IP包;A是FC over以太网,B是SCSI over IP,D是NAS文件协议。

          4. 下面哪一项是基于优先级的流控制的特点?A. 虚拟链路可独立暂停 B. 所有虚拟链路一起暂停 C. 实现基于带宽暂停虚拟链路 D. 实现基于优先级暂停单个物理链路答案:A解析:PFC在1条物理链路上创建8个虚拟链路,每个可独立暂停/重启;B是传统以太网暂停,C是ETS功能,D暂停虚拟链路而非物理链路。

          5. 哪项功能允许将带宽分配给FCoE 环境中的不同通信类别?A. 基于优先级的流控制 B. 增强传输选择 C. 拥挤通知 D. 数据中心桥接交换答案:B解析:ETS将带宽分配给LAN/SAN/IPC等类别,闲置带宽可共享;A是流控,C是拥挤预警,D是配置同步。

          第七章 网络连接存储(NAS)

          一、核心知识点

          1. NAS定义:基于IP的专用文件共享设备,支持CIFS(Windows)、NFS(Linux)协议,适合文件共享(如运营报表、视频素材)。

          2. NAS核心组件:NAS机头(含OS、文件系统、网络接口)、存储阵列(存数据)、网络接口(以太网)。

          3. NAS与通用服务器区别:NAS是单一用途(仅文件共享),OS优化(轻量,无冗余功能);通用服务器多用途(跑APP+文件共享),资源占用高。

          4. NAS文件共享协议

            1. CIFS:有状态(维护连接信息),支持自动恢复连接、文件锁定,Windows用。

            2. NFS:NFS v2/v3无状态(UDP/TCP),v4有状态(TCP),Linux用。

          5. NAS实施方式

            1. 统一NAS:整合NAS(文件)+SAN(数据块),支持CIFS/NFS/iSCSI/FC,统一管理。

            2. 网关NAS:NAS机头连外部存储(如FC SAN),机头与存储独立管理。

            3. 横向扩展NAS:多节点集群,单文件系统,扩展容量+性能(如添加节点,容量从10TB→50TB)。

          6. 文件级虚拟化:消除文件访问与物理位置的关联,用全局命名空间(逻辑路径)访问,支持无中断数据迁移。

          二、计算考点

          三、课后选择题(含答案+解析)

          1. NAS 机头的哪种组件会将文件级请求转换为数据块存储请求?A. 前端端口 B. 经过优化的操作系统 C. CIFS 和NFS D. 网络接口卡答案:B解析:NAS机头的优化OS负责协议转换(CIFS/NFS文件请求→数据块I/O请求);A是连主机端口,C是文件协议,D是网络接口。

          2. 哪项是横向扩展NAS 的功能?A. 将一般用途操作系统用于文件服务 B. 在群集中的每个节点上创建多个文件系统 C. 使用外部、单独进行管理的节点 D. 支持共用作为单个NAS 设备工作的节点答案:D解析:横向扩展NAS将多节点集群为“单个NAS设备”,单文件系统;A用优化OS,B单文件系统,C节点统一管理。

          3. 哪项是网关NAS 的功能?A. 对每个NAS 机头使用专用存储 B. NAS 机头和存储是单独进行管理的 C. 创建在所有NAS 机头上运行的单个文件系统 D. 提供iSCSI 和FC 主机连接答案:B解析:网关NAS的机头(管文件)与外部存储(管数据块)独立管理;A是统一NAS,C是横向扩展NAS,D是统一NAS功能。

          4. 哪种NAS 实施会整合对单个存储平台的基于文件和基于数据块的访问?A. 横向扩展 B. 网关 C. 统一 D. 网关和横向扩展答案:C解析:统一NAS的核心是“文件(NAS)+数据块(SAN)”整合访问,支持多协议;A/B仅支持文件或需外部存储。

          5. 哪一项是文件级虚拟化的优势?A. 使用户能够使用物理路径(而不是逻辑路径)访问文件 B. 无中断地将文件级请求转换为数据块存储请求 C. 整合对单个存储平台的基于NAS 和基于SAN 的访问 D. 消除了在文件级访问的数据与文件位置之间的相关性答案:D解析:文件级虚拟化用逻辑路径访问,消除“访问路径-物理位置”关联,支持无中断迁移;A用逻辑路径,B是NAS OS功能,C是统一NAS功能。

          第八章 基于对象的存储和统一存储

          一、核心知识点

          1. 基于对象的存储定义:以“对象”为单位存储非结构化数据(如视频/图片),对象含数据+元数据+唯一对象ID(哈希生成),单一地址空间(无目录层级)。

          2. 对象存储核心组件(OSD

            1. OSD节点:智能设备(CPU+存储+网络),管理本地对象。

            2. 元数据服务:存储对象ID、元数据,负责对象定位。

            3. 内部网络:连接OSD节点,传输数据。

          3. 对象存储流程

            1. 存储:应用→OSD节点(拆分数据/元数据)→生成对象ID→元数据服务存元数据/ID→存储服务存数据。

            2. 检索:应用→元数据服务(查对象ID)→OSD节点(用ID取数据)→返回应用。

          4. 内容寻址存储(CAS:专为固定内容(如用户认证照片、合同)设计,生成唯一内容地址(CA,基于数据二进制),防篡改、单实例存储。

          5. 统一存储

            1. 定义:整合数据块(SAN)、文件(NAS)、对象(OSD)访问,单平台+单管理界面,降成本、简化管理。

            2. 组件:存储控制器(数据块)、NAS机头(文件)、OSD节点(对象)、存储池(共享存储资源)。

            3. 数据访问:数据块请求→存储控制器;文件请求→NAS机头→存储控制器;对象请求→OSD节点→存储控制器。

          二、计算考点

          三、课后选择题(含答案+解析)

          1. 单一地址空间较层次结构地址空间而言有何优势?A. 高度可扩展且对性能影响最小 B. 根据保留策略提供对数据的访问 C. 使用同一接口提供对数据块、文件和对象的访问 D. 访问数据时使用的网络带宽更少答案:A解析:单一地址空间(对象存储)无目录层级,支持百万级对象存储,可扩展性高;B是CAS功能,C是统一存储功能,D与地址空间无关。

          2. OSD 节点中的元数据服务有何作用?A. 负责以对象的形式存储数据 B. 存储为对象生成的唯一ID C. 存储对象和对象ID D. 控制存储设备的功能答案:B解析:元数据服务专门存储对象的元数据和唯一ID;A是存储服务功能,C对象由OSD节点存储,D是OSD节点控制器功能。

          3. 使用下面哪一项在CAS 系统中生成对象ID?A. 文件元数据 B. 源和目标地址 C. 数据的二进制表示形式 D. 文件系统类型和所有权答案:C解析:CAS的对象ID(CA)基于数据二进制内容生成(如哈希值),内容不变则ID不变,确保完整性;A/B/D与CAS ID生成无关。

          4. 下面哪一项准确描述了统一存储中的数据块I/O 访问?A. I/O 穿过NAS 机头和存储控制器到达磁盘 B. I/O 穿过OSD 节点和存储控制器到达磁盘 C. I/O 穿过存储控制器到达磁盘 D. I/O 会直接发送到磁盘答案:C解析:统一存储中,数据块请求(如iSCSI/FC)直接经存储控制器到磁盘;A是文件I/O路径,B是对象I/O路径,D无控制器调度。

          5. 下面哪一项准确描述了统一存储?A. 在一个平台中提供数据块、文件和基于对象的访问 B. 使用对象提供数据块和文件存储访问 C. 使用单一地址空间支持数据块和文件访问 D. 专门构建用于归档的专用存储设备答案:A解析:统一存储的核心是“三合一”(数据块+文件+对象);B用对象中转,C是对象存储特征,D是CAS功能。

          第九章 业务连续性简介

          一、核心知识点

          1. 业务连续性(BC)定义:应对系统中断(灾难/故障/计划内维护),确保业务快速恢复的流程,含预防性(冗余)和应对性(恢复)措施。

          2. 信息可用性(IA)指标

            1. MTBF(平均无故障时间):总正常运行时间/故障次数→衡量可靠性。

            2. MTTR(平均修复时间):总宕机时间/故障次数→衡量可维护性。

            3. 可用性公式:**IA = MTBF / (MTBF + MTTR)**,如MTBF=7500h,MTTR=3h→IA≈99.96%。

            4. 可用性级别(几个9):99.99%→年宕机52分钟,99.999%→年宕机5分钟。

          3. BC关键术语

            1. RPO(恢复点目标):中断后可接受的数据丢失量(如2小时→最多丢2小时数据)。

            2. RTO(恢复时间目标):中断后业务恢复的最长时间(如30分钟→30分钟内恢复)。

          4. BC技术解决方案

            1. 消除单点故障:冗余组件(双交换机、NIC分组、冗余存储端口)。

            2. 多路径软件:识别备用I/O路径,负载平衡(分散I/O)、故障切换(路径断了自动切)。

          二、计算考点(高频)

          1. 可用性计算

            1. 示例:系统周一至周五8:00-17:00运行,周四13:00-19:00故障(宕机6小时,其中工作时间3小时)→总工作时间=5天×9h=45h,正常运行时间=45-3=42h→IA=42/45≈93.3%。

          2. MTBF/MTTR计算

            1. 示例:组件周二5:00-7:00(2h)、周四16:00-20:00(4h)、周五8:00-11:00(3h)故障→总宕机时间=2+4+3=9h,故障次数=3→MTTR=9/3=3h;总正常运行时间=(7天×24h)-9=159h→MTBF=159/3=53h。

          三、课后选择题(含答案+解析)

          1. 如果应用程序的恢复点目标(RPO) 为2 小时,则以下哪项陈述正确?A. 应用程序继续运行所需的时间必须短于2 小时 B. 应用程序继续运行所需的时间必须等于2 小时 C. 不超过2 小时的生产数据可能会丢失 D. 两次应用程序故障之间的平均时间为2 小时答案:C解析:RPO是“可接受的数据丢失量”,2小时RPO→最多丢2小时数据;A/B是RTO定义,D是MTBF定义。

          2. 以下哪项配置允许对两个或多个物理NIC 进行分组并将它们视为一台逻辑设备?A. NIC 流 B. NIC 移植 C. NIC 分组 D. NIC 分区答案:C解析:NIC分组(如Linux bonding)将多物理NIC→1逻辑NIC,冗余+负载平衡;A/B/D无此功能定义。

          3. 以下哪项最恰当地描述了恢复时间目标(RTO)?A. 中断之后必须将数据恢复到的时间点 B. 两次故障之间系统或组件可执行其正常操作的时间 C. 一段时间,系统和应用程序在中断后必须在此期间恢复 D. 企业可承担的数据丢失量答案:C解析:RTO是“恢复时间上限”;A是RPO定义,B是MTBF定义,D是RPO定义。

          4. 以下哪个表达式可从MTBF 和MTTR 方面表示系统的可用性?A. MTTR/(MTBF x MTTR) B. MTBF/(MTBF x MTTR) C. MTTR/(MTBF + MTTR) D. MTBF/(MTTR + MTBF)答案:D解析:可用性=正常运行时间/(正常运行时间+宕机时间)=MTBF/(MTBF+MTTR),对应选项D。

          5. 某部门要求能够在周一至周五的每天上午9 点至下午5 点访问数据库应用程序。上周四下午1 点应用程序崩溃,花了6 个小时才解决问题。应用程序在上周的可用性是多少?A. 85% B. 90% C. 95% D. 100%答案:B解析:总工作时间=5天×8h=40h;宕机时间=6h(其中工作时间4h:13:00-17:00);正常运行时间=40-4=36h;IA=36/40=90%。

          第十章 备份和归档

          一、核心知识点

          1. 备份定义:创建生产数据的额外拷贝,用于恢复丢失/损坏数据,目的:灾难恢复、操作恢复、归档。

          2. 备份粒度(高频考点)

            类型

            定义

            优点

            缺点

            恢复方式

            完整备份

            备份所有数据

            恢复快(仅需完整备份)

            慢、占空间

            直接用完整备份

            增量备份

            备份上次备份(任何类型)后变更的数据

            快、省空间

            恢复慢(完整+所有增量)

            完整备份+依次恢复增量

            累积备份

            备份上次完整备份后变更的数据

            恢复较快(完整+最新累积)

            比增量慢、占空间

            完整备份+最新累积备份

            1. 备份方法

              1. 热备份(在线):备份时APP运行,用打开文件代理备份正在使用的文件,适合核心业务。

              2. 冷备份(离线):备份时关APP,数据绝对一致,适合非核心业务。

              3. 裸机恢复:备份OS+硬件+APP配置,支持完整系统恢复。

            2. 备份拓扑:基于LAN(数据经LAN传,占带宽)、基于SAN(数据经SAN传,不占LAN)、直连(直接连备份设备)。

            3. 备份目标对比

              目标

              优点

              缺点

              适用场景

              磁带

              成本低、适合归档

              顺序访问、慢、易磨损

              长期归档

              磁盘

              随机访问、快、可靠

              成本高

              短期备份、核心业务

              虚拟磁带

              模拟磁带、快、可靠

              仅用于备份

              替代物理磁带

              1. 重复数据删除:消除冗余数据,降低存储/带宽成本;类型:

                1. 方法:文件级(单实例存储)、子文件级(固定/可变长度块)。

                2. 实施:基于源(备份前删冗余,省带宽)、基于目标(备份后删冗余,省存储)。

              2. 数据归档:存储固定内容(如旧视频、合同),满足合规;介质:在线(磁盘,快)、近线(磁带库,需装载)、离线(磁带,手动干预);解决方案:CAS(防篡改、单实例)。

              二、计算考点

              三、课后选择题(含答案+解析)

              1. 关于增量备份,以下哪项是正确的?A. 恢复只需上次完整备份和上次增量备份 B. 恢复只需上次增量备份 C. 复制自从上次完整备份或增量备份以来有更改的数据 D. 复制自从上次完整备份以来有更改的数据答案:C解析:增量备份备份“上次任何备份后”的变更数据;A需完整+所有增量,B需完整备份,D是累积备份定义。

              2. 虚拟化环境中基于映像的备份与传统备份方法相比有何优势?A. 减轻虚拟机管理程序的备份处理负担 B. 更快,因为它仅复制虚拟机磁盘数据 C. 更快,因为它仅复制虚拟机配置数据 D. 所需的空间是整个备份数据的一小部分答案:A解析:基于映像的备份在代理服务器上处理,不占用虚拟机管理程序资源;B/C复制完整映像(磁盘+配置),D空间与传统相当。

              3. 以下哪一项准确描述了备份服务器的角色?A. 收集要备份的数据并将其发送到存储节点 B. 负责将客户端发送的数据写入备份设备 C. 管理备份操作和维护备份目录 D. 控制磁带库中的机械臂答案:C解析:备份服务器核心是“管理+目录”(调度备份、记录备份元数据);A是备份客户端角色,B是存储节点角色,D是存储节点功能。

              4. 在磁带备份环境中,"来回走带"是什么意思?A. 从多数据流将数据写入单一磁带 B. 模拟磁盘驱动器并作为磁带提供给备份软件的过程 C. 当备份数据流中断时磁带机进行的重复的往复移动 D. 删除备份数据中冗余内容的过程答案:C解析:“来回走带”是磁带机因数据流中断,反复移动磁带寻找数据,导致性能下降;A是多数据流写入,B是虚拟磁带,D是重复数据删除。

              5. 基于源的重复数据删除有何优势?A. 提高了备份客户端的性能 B. 提高了备份服务器的性能 C. 将备份时段减至零 D. 减少了备份的网络带宽需求答案:D解析:基于源的重复数据删除在备份客户端删除冗余数据,仅传唯一数据→省网络带宽;A会占用客户端CPU(性能下降),B与服务器无关,C备份时段不会为零。

              第十一章 本地复制

              一、核心知识点

              1. 本地复制定义:同一数据中心内创建数据副本,用于快速恢复(如逻辑损坏)、测试、备份源。

              2. 复制副本核心要求

                1. 一致性:文件系统(刷新主机缓冲区)、数据库(按事务顺序复制)。

                2. 时间点(PIT):副本对应特定时间点(如10:00),支持恢复到该时间点。

              3. 本地复制技术(高频考点)

                类型

                实施位置

                原理

                优点

                缺点

                适用场景

                基于主机的复制

                主机

                LVM镜像(实时复制)、文件系统快照(CoFW)

                部署简单

                占主机CPU

                小容量数据(日志)

                基于阵列的复制

                存储阵列

                完整卷镜像(实时)、基于指针的复制(CoFW)

                不占主机资源

                依赖阵列功能

                大容量数据(数据库)

                基于网络的复制(CDP)

                主机-存储之间

                写操作拆分→日志卷,支持任意PIT恢复

                任意时间点恢复

                需额外设备(CDP应用装置)

                核心业务(零数据丢失)

                这页PPT在讲**“基于主机的LVM镜像复制技术”**,核心是解释它的**工作原理、性能影响和局限性**,我用通俗的逻辑帮你拆解:

                1. 什么是“基于LVM的镜像”?

                LVM(逻辑卷管理)是主机里的一种磁盘管理技术。“基于LVM的镜像”就是:

                主机里的**逻辑卷**(可以理解为“虚拟的磁盘分区”),会把每个数据块**同时复制到两个物理磁盘**(即“物理卷1”和“物理卷2”)上。

                类比:你保存一个文件,系统会同时把文件存到“硬盘A”和“硬盘B”里,相当于实时做了一份备份。

                2. 它是怎么工作的?(对应“逻辑块映射到两个物理块”)

                逻辑卷的每个数据块,都会在**两个物理磁盘**(物理卷1、2)上各存一份。比如你往逻辑卷里写1个文件,这个文件会同时出现在“硬盘A”和“硬盘B”里——这就是“镜像复制”的实现。

                3. 有什么缺点?

                性能损耗:“对CPU施加额外负荷,降低应用性能”

                因为写数据时要同时写两个磁盘,主机的CPU得干“双倍的活”,所以应用程序(比如数据库、办公软件)的运行速度会变慢。

                防故障能力弱:“副本和源在同一卷组,主机故障时都不可用”

                LVM的“卷组”是在**同一台主机**里的。如果主机本身坏了(比如主板故障、整机宕机),那么“源数据”和“镜像副本”都在这台主机里,会一起不可用。

                换句话说,它只能防**单个物理磁盘的故障**(比如硬盘A坏了,硬盘B还能用),但**防不了主机级的故障**(比如主机整机报废)。

                通俗例子辅助理解

                把主机想象成“你的电脑”,物理卷1、2是“电脑里的两个硬盘”:

                每次存文件,系统会同时把文件存到“硬盘A”和“硬盘B”里(镜像复制);

                坏处1:存文件要写两次,电脑CPU会更忙,导致你用软件时更卡(性能降低);

                坏处2:如果电脑整机坏了(比如主板烧了),两个硬盘里的文件都跟着废了,所以这种复制只能防“硬盘坏”,防不了“电脑坏”。

                总结:这页PPT的核心是告诉你——**基于主机LVM的镜像复制,能实时备份磁盘数据,但会拖累主机性能,且不能应对主机级的故障**。

                这张PPT讲的是**“文件系统快照”的工作原理**,它是一种基于主机的本地数据复制技术,核心是**“只复制变化的数据,大幅节省存储空间”**。以下用通俗逻辑和例子拆解:

                1. 核心角色:“生产FS”和“FS快照”

                生产FS(左边框):是正在运行的业务系统的文件系统(比如你电脑里的C盘),包含“元数据”(记录文件位置、属性的信息)和各种“数据块”(比如文件a、b、c、d……)。

                FS快照(右边框):是生产FS在**某个时间点的“数据快照”**,相当于给文件系统拍了一张“时间照片”,但它不是全量复制,只存“变化的部分”。

                2. 关键技术:“第一次写入时拷贝(CoFW)”

                当生产FS里的数据被修改时,系统会先把**“修改前的原始数据”复制到快照里**,再在生产FS中写入新数据。

                举个例子:

                生产FS里的“数据C”要被改成“数据c’”,系统会先把**原始的“数据C”**复制到快照空间,再在生产FS里写“数据c’”。

                这样,快照里保留了“修改前的C”,生产FS里是“修改后的c’”——既保证快照能还原旧数据,又不影响业务正常写入。

                3. 如何跟踪数据?——“位图”和“块图”

                位图:记录“哪些数据块在快照之后被修改过”(比如图中“位3-1、4-1”,表示数据块3、4被修改了)。

                块图:记录“快照里的原始数据存在哪个位置”(比如图中“BLK3-2”,表示数据块3的原始数据存在快照的“3-2”位置)。

                当需要恢复快照时,系统通过“位图”知道“哪些块被改了”,再通过“块图”找到“快照里的原始数据”,就能还原出某个时间点的完整文件系统。

                4. 优点:“省空间”

                因为只复制“变化的数据”,所以快照只需要“生产FS所用空间的一小部分”,非常节省存储资源。

                通俗例子辅助理解

                把“生产FS”想象成你的手机相册,“FS快照”就是某一时刻的相册备份:

                平时相册里的照片会新增/删除(数据变化);

                当你第一次修改某张照片(比如P图),系统会先把“P图前的原图”存到快照空间,再保存P图后的新照片;

                “位图”就像“记录哪些照片被P过”的清单,“块图”就像“原图存在哪个文件夹”的地图;

                这样,你随时可以通过快照还原出“P图前的相册状态”,且因为只存了变化的“原图”,非常省空间。

                总结:这张图的核心是解释**文件系统快照如何通过“只复制变化数据+指针/位图/块图跟踪”的方式,实现高效的本地数据复制和时间点还原**,既省空间又不影响业务运行。

                这张图讲解的是**“完整卷镜像”的工作机制**,属于存储阵列级的本地复制技术,核心是通过“镜像卷”实现数据备份或容灾,分为两个阶段理解:

                1. 上方“已连接”阶段:实时同步镜像

                生产主机:正常读写“源卷”(业务数据的存储卷)。

                存储阵列:将“源卷”的所有数据**实时复制到“目标卷”**,相当于给源卷做了一份“实时备份”。

                BC主机(备份/容灾主机):此时“目标卷”处于“未就绪”状态——因为还在同步过程中,BC主机暂时无法访问它。

                2. 下方“断开 - PIT(时间点)”阶段:镜像卷独立可用

                当需要使用镜像卷时,**源卷和目标卷的复制关系被断开**。

                此时“目标卷”成为“源卷”在**某个时间点(PIT)的完整镜像副本**,BC主机可以对其进行“读/写”操作(比如用于数据恢复、业务临时切换)。

                通俗类比

                把“源卷”想象成你正在编辑的Word文档,“目标卷”是它的“实时备份副本”:

                已连接阶段:你每打一个字,备份副本就同步更新,但此时备份副本是“锁定”的,别人不能编辑;

                断开 - PIT阶段:你主动停止同步,备份副本就变成“某一时刻的文档快照”,别人可以打开它编辑、恢复数据。

                总结:这张图展示了**存储阵列如何通过“完整卷镜像”技术,先实时同步数据,再在需要时断开形成“时间点镜像副本”**,用于数据备份或业务容灾。

                这部分内容讲的是**“基于指针的完整卷复制”技术**,核心是通过“第一次访问时才拷贝数据”的策略,实现高效的卷级数据复制(常用于备份、容灾或测试)。以下分**核心概念、两种复制模式、三张场景图**逐一拆解:

                一、核心概念

                “基于指针的完整卷复制”是存储阵列级的复制技术,目标是在**目标设备**上生成**源数据的完整拷贝**,但不是“一开始就全量复制”,而是通过**指针跟踪**和**“第一次访问时拷贝”**的策略,按需复制数据,从而节省时间和IO资源。

                关键特性:

                目标设备容量需**至少与源设备相同**(因为是完整拷贝)。

                复制会话激活后,**BC主机(备份/容灾主机)可立即访问目标设备**,但此时目标并非完整数据,而是通过“保护位图”跟踪源的变化。

                PIT(时间点) 由“会话激活时间”决定(即复制开始时的源数据快照)。

                二、两种复制模式

                完整拷贝模式

                会话启动后,后台**全量复制源的所有数据到目标**(类似“一次性把整本书抄完”),是传统的全量复制逻辑。

                第一次访问时拷贝(延迟拷贝)

                核心是**“按需拷贝”**——只有当“源或目标被读/写访问”时,才将对应数据块从源拷贝到目标(类似“有人要看/写某页,才把这页从原书抄到副本”)。这是重点,以下结合三张图详细解释。

                三、场景图拆解(第一次访问时拷贝)

                1. 写入源(生产主机写源卷)

                场景:生产主机向**源卷**写入新数据 C’

                过程:

                因为是“复制会话激活后第一次写源”,系统会先把**源卷中该地址的原始数据 C 拷贝到**目标卷**,然后再在源卷中写入 C’

                目的:保证目标卷中保留“会话激活时的原始数据 C”,即PIT时间点的快照。

                类比:你要在“原日记(源)”写新内容 C’,系统会先把“原日记里没写 C’ 之前的 C 页”抄到“副本日记(目标)”,再在原日记写 C’。这样副本里永远有“没写 C’ 时的 C 页”。

                2. 写入目标(BC主机写目标卷)

                场景:BC主机(备份/容灾主机)向**目标卷**写入新数据 B’

                过程:

                系统会先把**源卷中的原始数据 B 拷贝到目标卷,然后再在目标卷中写入 B’

                目的:保证目标卷在写入新数据时,仍保留“会话激活时的原始数据 B”的快照逻辑。

                类比:你要在“副本日记(目标)”写新内容 B’,系统会先把“原日记里的 B 页”抄到副本,再在副本写 B’。这样副本的 B 页变成 B’,但原日记的 B 页还是原来的,副本里保留了“抄的时候的 B 页”。

                3. 从目标读取(BC主机读目标卷)

                场景:BC主机读取**目标卷**的数据 A

                过程:

                系统会先把**源卷中的原始数据 A 拷贝到目标卷,然后供BC主机读取。

                注意:“目标上的数据无法用于恢复”——因为这种“按需拷贝”是逐步进行的,若源卷故障,目标卷可能只有部分数据(比如只抄了 A 页,其他页还没抄),因此它**不适合作为“完整恢复源卷”的备份**,更多用于测试、临时容灾等场景。

                类比:你要读“副本日记(目标)”的 A 页,系统会先把“原日记里的 A 页”抄到副本,然后你读副本的 A 页。但如果原日记丢了,副本可能只有 A 页,其他页没抄,所以没法用副本恢复完整的原日记。

                总结

                “基于指针的完整卷复制(第一次访问时拷贝)”是一种**高效的按需复制技术**,通过“访问时才拷贝数据”避免了全量复制的开销,适合对“实时性要求不高、或用于测试/临时容灾”的场景,但不适合作为“完整恢复源数据”的备份方案(因为数据是逐步拷贝的,可能不完整)。

                “基于指针的完整卷复制”和“完整卷镜像”的不同

                要清晰区分**“基于指针的完整卷复制”**和**“完整卷镜像”**,可以从**复制机制、数据一致性、可用性、应用场景**等维度逐一对比:

                对比维度

                完整卷镜像

                基于指针的完整卷复制(第一次访问时拷贝)

                复制时机

                实时同步:源卷有写操作时,立即同步到目标卷,是“全量实时复制”。

                按需复制:仅在**第一次访问(读或写)某数据块**时,才将该数据块从源卷拷贝到目标卷,是“按需增量复制”。

                数据一致性

                断开复制关系后,目标卷是源卷在“时间点(PIT)”的**完整、一致副本**(所有数据块都已同步)。

                目标卷是**逐步构建**的:未被访问的数据块不会复制到目标,若源卷故障,目标卷可能只有部分数据,存在“数据不完整、不一致”的风险。

                目标可用性

                同步阶段目标卷“未就绪”(无法访问);断开后目标卷可**独立读写**,且数据完整一致。

                复制会话激活后,目标卷**立即可访问**,但此时数据是“逐步填充”的(未访问的块无数据)。

                应用场景

                适合**容灾恢复**:源卷故障后,可直接用目标卷(完整一致副本)接管业务。

                适合**测试、临时访问**(如开发环境验证数据):目标卷数据可能不完整,无法用于“源卷故障后的完整恢复”,但初始访问开销小。

                资源开销

                实时同步对存储IO、带宽开销大(需持续同步所有写操作)。

                按需复制初始开销小(不用全量复制),仅在访问数据块时消耗资源,整体更节省IO和时间。

                通俗类比理解

                • 完整卷镜像:像“实时备份的U盘”,源文件改了就立即同步,拔下U盘后,U盘中的文件和源文件在“拔下时刻”完全一致,能直接用来恢复源文件。

                • 基于指针的完整卷复制:像“按需下载的云盘”,只有当你要读/写某个文件时,才下载该文件到本地,云盘里的文件是逐步下载的,若源文件(云服务器上的文件)突然删除,本地可能只下载了部分文件,无法完全恢复源文件。

                通过以上对比,你可以根据业务对“数据完整性、实时性、资源开销”的需求,选择更适合的技术:

                • 若需要**完整、一致的容灾副本**(如核心业务数据恢复),选**完整卷镜像**;

                • 若需要**快速启动复制、对资源开销敏感**(如测试环境临时用数据),选**基于指针的完整卷复制**。

                “基于指针的虚拟复制”是一种**极度节省空间、按需复制数据**的本地复制技术,核心是“目标不存实际数据,只存指向数据位置的指针”。以下从**核心逻辑、场景拆解、适用价值**三方面帮你吃透:

                一、核心概念拆解

                “指针”的作用:目标设备里**没有实际数据**,只存“指向源设备数据位置的指针”。打个比方,目标就像“带目录的书签”,书签里记录着“某页数据在源卷的第几行第几列”,自身不存内容。

                空间开销:因为只存指针,目标仅需源卷大小的**一小部分空间**(比如源卷1TB,目标可能只需几十GB存指针和少量拷贝的数据)。

                访问实时性:复制会话一开始,目标设备就能被访问(因为指针是现成的,不用等全量数据复制)。

                CoFW原则:和之前的文件系统快照类似,采用“**第一次写入时拷贝**”——只有当数据被修改时,才把“修改前的原始数据”拷贝到“保存位置”,保证目标指针始终能指向正确的历史数据。

                适用场景:适合**源数据改动率低于30%** 的场景(比如核心数据库,日常改动少,大部分数据还是原始状态)。

                二、场景图详解

                1. 写入源(生产主机向源卷写数据)

                场景:生产主机向**源卷**写入新数据 C’

                过程:

                ① 系统先把源卷中该地址的**原始数据 C 拷贝到“保存位置”;

                ② 更新目标虚拟设备的**指针**,让它指向“保存位置里的原始数据 C”;

                ③ 最后才在源卷中写入新数据 C’

                目的:保证目标的指针始终能指向“写入前的原始数据 C”,即保留了某一时刻的历史快照。

                类比:你在“原书(源卷)”的某页写新内容前,先把“原页(原始数据 C)”复印到“存档册(保存位置)”,然后在原书改内容。“目标虚拟设备”的书签(指针)就从“原书某页”改成“存档册某页”,这样随时能通过书签找到“改前的原页”。

                2. 写入目标(BC主机向目标虚拟设备写数据)

                场景:BC主机(备份/容灾主机)向**目标虚拟设备**写入新数据 A’

                过程:

                ① 先把源卷中的**原始数据 A 拷贝到“保存位置”;

                ② 更新目标虚拟设备的指针,让它指向“保存位置里的原始数据 A”;

                ③ 在“保存位置”里再复制一份原始数据 A(防止后续改动覆盖),然后写入新数据 A’

                ④ 目标读数据时,是“源卷没改动的数据(如 BC’)” + “保存位置改动后的数据(如 A’)”的组合。

                目的:既保证目标能访问历史原始数据,又支持对目标的写入操作,同时不破坏源数据的完整性。

                类比:你在“书签(目标指针)”对应的“存档册某页(原始数据 A)”上写新内容前,先复印一份“存档册的原页”,再在复印页写新内容。这样书签还是能指向“存档册的原页”,同时你也有了“写过新内容的复印页”,读的时候两者结合就能得到完整逻辑。

                三、技术价值总结

                极致省空间:目标只存指针,不用全量复制数据,适合大规模存储场景。

                访问零等待:会话启动后目标立即可用,不用等漫长的全量复制。

                数据可追溯:通过CoFW和保存位置,能随时找回“某一时刻的原始数据”,满足备份、审计需求。

                适用场景:核心业务系统(如数据库)且日常改动少(改动率<30%)的场景,既能省资源,又能保证数据可恢复。

                简单来说,“基于指针的虚拟复制”是个“**用书签管理数据,按需复印历史页**”的聪明技术——既省空间、又能快速访问,还能追溯历史数据,非常适合对存储成本和恢复时效都有要求的核心业务场景。

                1. 基于指针的复制核心原理(CoFW:第一次写入时拷贝)

                  1. 源写入:先将旧数据拷到副本“保存位置”,再改源数据→副本保留旧数据。

                  2. 副本写入:先将源旧数据拷到“保存位置”,再改副本→副本保留旧数据。

                2. 虚拟化环境复制

                    把 “镜像虚拟卷” 想象成 **“由多个不同品牌硬盘组装的‘智能虚拟硬盘’”**:

                    你(主机)只需要和这个 “虚拟硬盘” 交互;

                    背后的 “虚拟化应用装置” 负责把不同品牌的硬盘(存储阵列的 LUN)拼成这个 “虚拟硬盘”;

                    这个 “虚拟硬盘” 会自动把数据复制到多个物理硬盘(镜像分支),哪怕一个硬盘坏了,其他硬盘里的副本还能正常使用。

                    总结:“虚拟卷镜像” 通过存储虚拟化技术,将异构物理存储整合成虚拟卷后再做镜像复制,既实现了存储资源的灵活管理,又保证了数据的高可用性,是企业级存储容灾的重要技术之一。

                  1. 虚拟卷镜像:虚拟化应用装置复制虚拟卷。

                • 虚拟机快照:捕获PIT状态(系统+数据),恢复快。 简单来说,虚拟机快照就是给虚拟机 “存档”,随时能 “读档” 回到某个健康状态,是虚拟机容灾、测试的关键技术。

                • 虚拟机克隆:复制完整VM,独立于源(测试用)。 简单来说,虚拟机克隆就是 “复制粘贴一台一模一样的虚拟机,且彼此独立不干扰”,是测试、批量部署场景下的高效解决方案。

                二、计算考点

                三、课后选择题(含答案+解析)

                1. 基于指针的虚拟复制有何优势?A. 源设备无需正常运行即可进行恢复 B. 无需保存位置即可激活会话 C. 创建复制副本所需的存储空间更少 D. 复制不会对源产生性能影响答案:C解析:基于指针的虚拟复制仅存指针和修改数据,副本空间是源的一小部分(如500TB源→50TB副本);A需源正常(指针指向源),B需保存位置,D会有轻微性能影响(CoFW操作)。

                2. 有关基于指针的完整卷复制,以下哪一项是正确的?A. 目标大小是源的一小部分 B. 目标大小至少与源大小相同 C. 仅在同步完成并从源上断开后才能进行访问目标 D. 目标始终只包含指向保存位置的指针答案:B解析:基于指针的完整卷复制是“完整拷贝”,目标需至少与源同大小;A是虚拟复制特征,C立即可访问,D包含完整数据(非仅指针)。

                3. 在连续数据保护技术中,以下哪项因素决定着恢复点可退回的时间范围?A. 为复制副本配置的空间量 B. 复制中使用的写操作拆分器的类型 C. 为日志配置的空间量 D. 复制副本的更改率答案:C解析:CDP的日志卷存储所有写操作日志,日志空间越大,可保存的历史日志越多→恢复点范围越广;A/B/D与恢复点范围无关。

                4. 在CoFA 复制模式下,数据何时从源拷贝到目标?A. 首次从源上的位置发出读命令时 B. 首次向源上的位置发出读写命令时 C. 首次向目标上的位置发出读写命令时 D. 向源上的位置发出所有写命令时答案:B解析:CoFA(第一次访问时拷贝):首次对源/目标的位置读写时,先拷源旧数据到目标,再执行读写;A仅读不触发,C漏了源的写,D所有写触发(错误,仅首次)。

                5. 虚拟机从其快照恢复时,来宾操作系统配置会发生什么情况?A. 来宾操作系统配置会恢复到快照创建PIT B. 会保留当前来宾操作系统配置 C. 来宾操作系统配置将复制到新的虚拟机中 D. 来宾操作系统设置会丢失且需要手动配置答案:A解析:虚拟机快照包含“系统配置+数据”,恢复时会将配置和数据一起恢复到快照创建时间点;B/C/D与快照恢复功能矛盾。

                第十二章 远程复制

                一、核心知识点

                1. 远程复制定义:在远程站点创建数据副本,应对区域灾难(如地震/洪水),实现异地灾备。

                2. 远程复制模式(高频考点)

                  模式

                  原理

                  RPO

                  带宽需求

                  距离限制

                  适用场景

                  同步复制

                  写源→写远程→确认主机

                  接近0

                  >最大写入负载

                  <200km(延迟低)

                  核心数据(如支付记录)

                  异步复制

                  写源→确认主机→缓冲后写远程

                  非零(如10min)

                  ≥平均写入负载

                  无(如跨国家)

                  非核心数据(如日志)

                  1. 远程复制技术

                    1. 基于主机:LVM复制(同步/异步)、日志传送(数据库,传事务日志),占主机CPU。

                    2. 基于阵列:阵列自带功能,支持同步/异步/磁盘缓冲(先本地复制,再传远程,省带宽),不占主机资源。

                    3. 基于网络(CDP):加CDP应用装置,支持任意PIT恢复,适合核心业务。

                  2. 三站点复制:提升灾备安全性,模式:

                    1. 级联:源→站点A(同步)→站点B(异步/磁盘缓冲)。

                    2. 三角形:源→站点A(同步)、源→站点B(异步),A与B互相同步。

                  3. 数据迁移:异构阵列间移动数据,方式:

                    1. 推送:控制阵列→远程阵列;拉入:远程阵列→控制阵列。

                    2. 热迁移:迁移时主机可访问数据(热推/热拉,先复制再读写)。

                  4. 虚拟化环境远程复制

                    1. 虚拟卷镜像:虚拟卷复制到远程站点。

                    2. 虚拟机迁移:虚拟机管理程序到管理程序(需共享存储)、阵列到阵列(移动VM文件)。

                  二、计算考点

                  三、课后选择题(含答案+解析)

                  1. 哪个因素会影响同步远程复制解决方案中的写入响应时间?A. 源阵列上的LUN 数 B. 远程阵列上的LUN 数 C. 源和远程站点之间的距离 D. 远程阵列上配置的RAID 级别答案:C解析:同步复制需“写源+写远程”后确认,距离越远(如100km→5ms延迟,1000km→50ms延迟),响应时间越长;A/B/D与响应时间无直接关联。

                  2. 下面哪一项准确描述了异步远程复制?A. 在发生灾难时提供接近零的RPO B. 不适合超出200 千米的距离 C. 向主机确认前,写入会提交到源和复制副本 D. 写入提交到源,并立即向主机确认答案:D解析:异步复制的核心是“先确认主机,再缓写远程”;A是同步复制特征,B适合长距,C是同步复制原理。

                  3. 下面哪一项决定异步远程复制中的RPO?A. 应用装置响应时间 B. 平均读取工作负载 C. 缓冲区的大小 D. 远程阵列上的LUN 数答案:C解析:异步复制的RPO取决于“缓冲区大小”(缓冲越大,可存储更多待传数据,RPO越小)和带宽(带宽越大,传得越快,RPO越小);A/B/D与RPO无关。

                  4. 级联/多级跳(同步+ 磁盘缓冲)三站点复制中,至少需要多少个存储卷?A. 2 B. 3 C. 4 D. 5答案:B解析:级联模式需“源卷+站点A卷(同步副本)+站点B卷(磁盘缓冲副本)”,共3个卷;A是双站点复制,C/D多余。

                  5. 有关虚拟机管理程序到虚拟机管理程序虚拟机迁移的描述,哪一项是正确的?A. 将虚拟机文件从源阵列移动到远程阵列 B. 支持在不同的存储阵列中移动虚拟机 C. 需要源和目标虚拟机管理程序访问同一存储 D. 在迁移过程中需要虚拟机脱机答案:C解析:虚拟机管理程序到管理程序迁移,需源和目标访问同一存储(如共享SAN),仅迁移VM内存状态;A是阵列到阵列迁移,B不支持不同存储,D支持在线迁移(不脱机)。

                  第十三章 云计算

                  一、核心知识点

                  1. 云计算定义(NIST):按需访问可配置IT资源池(服务器/存储/网络),最小管理干预,特征:

                    1. 按需自助服务:用户自动调配资源(如阿里云控制台开虚拟机)。

                    2. 广泛网络访问:多客户端访问(PC/手机/平板)。

                    3. 资源共用:多用户共享资源池(如1台物理机跑多租户VM)。

                    4. 快速灵活:快速扩展/缩减资源(如双11临时扩容量)。

                    5. 可计量的服务:按使用计费(如按CPU小时/GB存储收费)。

                  2. 云服务模式(高频考点)

                    模式

                    定义

                    用户控制范围

                    示例

                    IaaS

                    提供基础设施(计算/存储/网络)

                    OS/APP/数据

                    阿里云EC2、AWS S3

                    PaaS

                    提供平台(OS/数据库/中间件)

                    APP/数据

                    Google App Engine、Azure

                    SaaS

                    提供应用程序(按需使用)

                    仅数据

                    钉钉、Salesforce CRM

                    1. 云部署模式

                      1. 公有云:服务商提供,多租户(如阿里云),成本低。

                      2. 私有云:企业自建,单租户(如华为企业云),安全高。

                      3. 社区云:多个企业共享(如医疗行业云),合规性好。

                      4. 混合云:公有云+私有云(如核心数据放私有云,非核心放公有云),平衡成本与安全。

                    2. 云基础架构:物理层(服务器/存储/网络)、虚拟层(资源池/虚拟资源)、应用层(APP/平台软件)、管理层(管理/访问软件)。

                    3. 云挑战:用户角度(安全/合规、网络延迟、供应商锁定);提供商角度(服务保证、软件许可证、无标准接口)。

                    二、计算考点

                    三、课后选择题(含答案+解析)

                    1. 哪项功能是由云计算提供的?A. 单向资源调配 B. 与服务提供商进行人工互动 C. 增加产品上市时间 D. 供应商锁定答案:A解析:云计算支持“单向资源调配”(用户自主扩/缩容);B需最小人工互动,C缩短上市时间,D是挑战(非功能)。

                    2. 根据NIST,什么是云的本质特征?A. 开放API B. 基于策略的监控 C. 可计量的服务 D. 软件即服务答案:C解析:NIST定义的5大本质特征:按需自助、广泛网络访问、资源共用、快速灵活、可计量的服务;A/B是附加功能,D是服务模式。

                    3. 基础架构即服务中提供哪些内容?A. 数据库管理系统 B. 操作系统 C. 应用程序 D. 存储答案:D解析:IaaS提供“基础设施”(计算/存储/网络);A是PaaS提供,B用户可自主安装(非IaaS提供),C是SaaS提供。

                    4. 哪一项是云中的虚拟基础架构的组件?A. 管理软件 B. 存储阵列 C. 网络标识池 D. 服务目录答案:C解析:虚拟基础架构组件包括资源池(CPU/内存/存储)、标识池(VLAN ID/VSAN ID)、虚拟资源(VM/虚拟卷);A是管理层,B是物理层,D是用户界面。

                    5. 针对云优化的存储的特征是什么?A. 以服务器为中心 B. 位置相关 C. 安全的多重租用 D. 单一访问机制答案:C解析:云优化存储特征:大规模可扩展、统一命名空间、基于策略管理、安全多租户(隔离多用户数据)、多访问机制;A是DAS特征,B是传统存储特征,D支持多访问机制(REST/SOAP/NFS)。

                    http://www.dtcms.com/a/605786.html

                    相关文章:

                  3. 西门子1500PLC(模拟器)与Matlab经由Modbus通信联合PID仿真
                  4. 【LeetCode】110. 平衡二叉树
                  5. LeetCode 423 - 从英文中重建数字
                  6. 建设部信息中心网站提供模板网站制作多少钱
                  7. 徐州集团网站建设关键词排名霸屏代做
                  8. 将现有git项目推送到gitcode的方法
                  9. 鸿蒙PC生态三方软件移植:开发环境搭建及三方库移植指南
                  10. F280049C学习笔记之SDFM
                  11. Linux内存管理深度解析:从首次访问缺页处理到NUMA策略的完整架构
                  12. 北京网站设计与制作品牌网站建设策划书
                  13. Java 9+ 模块化系统(Jigsaw)实战:从 Jar 地狱到模块解耦的架构升级
                  14. Claude Code 深度解析:架构、工作原理与常见误解
                  15. 珠海市企业网站制作品牌仿简书wordpress博客主题
                  16. 文化传媒 网站设计成都网站建设:
                  17. Python实用指南:python + pyqt
                  18. SSM基于J2EE的山西旅游网站的设计与实现iiqmx(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
                  19. 如何通过 WebSocket 接入期货实时行情接口
                  20. 开源 Objective-C IOS 应用开发(六)Objective-C 和 C语言
                  21. 网站栅格安装网站模版视频
                  22. PHP While 循环
                  23. Docker 部署 DeepSeek-OCR 和WebUI
                  24. 长沙h5网站建设什么软件可以发布广告信息
                  25. 如何保证数据库与 Redis 的数据一致性
                  26. redis连接服务
                  27. Linux systemd闲谈杂话(第一篇:概述)
                  28. Spring 核心技术解析【纯干货版】- XII:Spring 数据访问模块 Spring-R2dbc 模块精讲
                  29. 手机什么网站可以设计楼房关于网站建设的调查问卷
                  30. 零基础网站建设教学申请自己邮箱域名
                  31. JVM 内存结构、堆细分、对象生命周期、内存模型全解析
                  32. 网络安全编程——基于Python实现的SSH通信(Windows执行)