《信息存储与管理》完整复习手册
说明
本手册涵盖课程13章核心知识点、高频计算考点及每章PPT课后选择题(含答案+详细解析),重点标注高频考点及计算公式,助力高效复习。
第一章 绪论
一、核心知识点
数据与信息
数据:未经处理的事实集合(如原始日志);信息:从数据中派生的知识(如用户行为分析报告)。
数据类型:结构化数据(数据库表,占10%)、非结构化数据(视频/邮件/图片,占90%)。
数据中心核心元素(5个):应用程序、数据库管理系统(DBMS,如MySQL/Oracle)、主机(计算)、网络、存储。
存储核心目标:高性能(吞吐率高、延迟低)、高可靠性(数据不丢失)、高可用性(服务不中断)。
关键技术概念:
虚拟化:抽象物理资源为逻辑资源(如Docker容器、VMware虚拟机),提高资源利用率。
云计算:按需使用IT资源(如阿里云),特征:自助服务、资源共用、可计量、快速扩展。
二、计算考点
无
三、课后选择题(含答案+解析)
以下哪一项是结构化数据的示例?A. 映像 B. PDF文档 C. 数据库 D. 网页答案:C解析:结构化数据以行列结构存储,数据库(如MySQL表)是典型;A/B/D均为非结构化数据。
关于大数据,以下哪项是正确的?A. 仅包括非结构化数据 B. 包括来自单个源的数据 C. 使用传统软件工具高效捕获 D. 数据大小超出传统软件的处理能力答案:D解析:大数据定义为“超出常用软件工具处理能力的数据集”,含结构化+非结构化数据(A错),来自多源(B错),传统工具无法高效处理(C错)。
以下哪一项是以信息为中心的体系结构的功能?A. 内置于服务器之中的存储 B. 防止在服务器之间共享存储 C. 单个系统中包括服务器、网络和存储 D. 存储将得到集中管理且独立于服务器答案:D解析:信息为中心的体系结构(如SAN/NAS)核心是存储独立于服务器、集中管理;A是DAS特征,B与共享理念矛盾,C是超融合架构(HCI)特征。
以下哪一项准确描述了虚拟化?A. 提供按需计量服务 B. 将物理资源抽象化为逻辑资源 C. 共用逻辑资源以提供数据完整性 D. 支持跨数据中心的分散式管理答案:B解析:虚拟化的核心是“物理→逻辑抽象”(如1台物理机拆为3台VM);A是云计算特征,C/D与虚拟化定义无关。
以下哪项要求是指存储解决方案能够随业务一同增长?A. 可用性 B. 可管理性 C. 完整性 D. 可扩展性答案:D解析:可扩展性指存储容量/性能随业务需求增长而扩展;A是服务不中断,B是易管理,C是数据不篡改。
第二章 数据中心环境
一、核心知识点
应用程序I/O特性
读写类型:读取密集型(如报表系统)、写入密集型(如短视频APP)。
I/O模式:按序(如视频播放)、随机(如数据库查询);I/O大小(4KB/64KB等)。
主机组件
硬件:CPU、内存(支持虚拟化,交换空间=磁盘模拟内存)。
软件:OS(如Linux)、LVM(逻辑卷管理,将多个物理卷→卷组→逻辑卷,支持分区/合并)、文件系统(日志型如EXT4,原子性事务保障数据完整)。
连接协议参数
协议
版本
带宽
速度
最大长度
适用场景
SATA
3.0
6Gb/s
600MB/s
2米
普通PC硬盘
SAS
4.0
24Gb/s
-
10米
服务器硬盘
PCIe
4.0 x16
32GB/s
-
-
显卡/高速设备
存储设备:磁带(低成本归档)、光盘(小容量分发)、HDD(机械盘,随机访问)、SSD(闪存,无机械延迟,高性能)。
直连存储(DAS):主机直接连存储,部署简单、成本低,但可扩展性差(端口有限)。
二、计算考点(高频)
磁盘服务时间计算
公式:**磁盘服务时间 = 寻道时间 + 旋转延迟 + 数据传输时间**
旋转延迟:(60/磁盘转速)/ 2(平均旋转半周),如15000rpm硬盘:(60/15000)/2 = 2ms。
传输时间:数据块大小 / 数据传输速度,如4KB数据、40MB/s传输速度:4KB / 40MB/s ≈ 0.1ms。
示例:15000rpm硬盘(寻道5ms、传输40MB/s)处理4KB数据,服务时间=5+2+0.1≈7.1ms。
所需磁盘数量计算(需同时满足容量和性能需求)
容量需求磁盘数(Dc):总容量需求 / 单盘容量。
性能需求磁盘数(Dp):峰值IOPS /(单盘IOPS × 0.7)(性能敏感型应用利用率≤70%)。
最终磁盘数:**max(Dc, Dp)**
示例:容量需求1.46TiB,单盘146GiB→Dc=10;峰值IOPS 9000,单盘IOPS 180→Dp=9000/(180×0.7)≈72→最终72盘。
三、课后选择题(含答案+解析)
以下哪一项是计算虚拟化的好处?A. 支持计算内存交换 B. 提高计算利用率 C. 将计算内存与应用程序隔离 D. 将计算OS与应用程序隔离答案:B解析:计算虚拟化(如VM)让1台物理机跑多台VM,资源利用率从30%→80%;A是内存虚拟化功能,C/D与虚拟化核心好处无关。
哪一项是对虚拟机(VM)的最佳描述?A. 物理服务器上的所有虚拟机都必须运行同一OS B. 当虚拟机关闭时会删除虚拟机文件 C. 虚拟机是独立的文件组 D. 所有虚拟机平等共享可用资源答案:C解析:VM以文件形式存储(如.vmdk磁盘文件),是独立文件组;A可跑不同OS(如Windows+Linux),B关闭不删文件,D可按需分配资源(非平等)。
什么是合并?A. 将多个物理驱动器分组到逻辑驱动器 B. 将物理驱动器分为多个逻辑驱动器 C. 在逻辑驱动器上写入磁盘元数据的过程 D. 通过碎片整理向物理驱动器添加更多容量答案:A解析:合并是LVM功能,将多物理卷→卷组→逻辑卷(如2个500GB→1个1TB逻辑卷);B是分区,C/D与合并定义无关。
哪些因素决定机械磁盘的总体服务时间?A. 磁盘缓冲时间、全程和旋转延迟 B. 内部传输速度、外部传输速度和缓冲时间 C. 全程、平均寻道时间和道间寻道时间 D. 平均寻道时间、旋转延迟和数据传输时间答案:D解析:机械磁盘服务时间由“寻道(磁头移动)+旋转(盘片转动)+传输(数据读写)”三部分组成,对应选项D。
哪一项是DAS环境的挑战?A. 性能低 B. 可扩展性有限 C. 部署复杂性 D. 最初投资过多答案:B解析:DAS端口有限(如存储阵列只有4个SAS口),最多连4台主机,可扩展性差;A性能不低(适合单主机),C部署简单,D初始投资低。
第三章 数据保护-RAID
一、核心知识点
RAID定义与目的:将多磁盘合并为逻辑单元,提供容错(防磁盘故障)和/或性能提升,解决单盘MTBF低的问题(如1000台盘MTBF=单盘MTBF/1000)。
RAID实现方式
软件RAID:依赖主机CPU,支持RAID级别少,影响主机性能。
硬件RAID:专用RAID控制器(主机/阵列),独立处理RAID计算,支持全级别,性能好。
RAID三大核心技术
分条(Striping):数据拆分为条带(固定大小),跨盘存储,并行读写→提升性能(RAID0核心)。
镜像(Mirroring):数据实时复制到另一磁盘,容错性强→RAID1核心,写入次数翻倍(1次写→2次)。
奇偶校验(Parity):XOR运算生成校验数据(D1⊕D2⊕D3=P),单盘故障可恢复→RAID3/5/6核心。
常用RAID级别对比(高频考点)
RAID级别
最少磁盘
可用容量%
读取性能
写入性能
容错能力
适用场景
0
2
100
优
优
无
临时文件/非关键数据
1
2
50
良
差(2次写)
单盘故障
数据库日志/关键小数据
10
4
50
优
良
多盘故障(不同镜像)
核心业务(OLTP/RDBMS)
5
3
(n-1)/n×100
良
中(4次写)
单盘故障
邮件/普通业务
6
4
(n-2)/n×100
良
差(6次写)
双盘故障
归档/不可中断业务
二、计算考点(高频)
RAID性能损失计算(IOPS负载)
核心逻辑:不同RAID级别“写1次=多IO操作”,负载=读IOPS + 写IOPS×写次数
RAID级别
写1次对应IO次数
原因(读旧数据/旧校验+写新数据/新校验)
1/10
2
镜像:写源盘+写镜像盘
5
4
读旧数据+读旧校验→写新数据+写新校验
6
6
读旧数据+读2个旧校验→写新数据+写2个新校验
示例:高峰IOPS 1200,读写比2:1→读IOPS=800,写IOPS=400
RAID10负载:800 + 400×2 = 1600 IOPS
RAID5负载:800 + 400×4 = 2400 IOPS
分条大小计算(奇偶校验RAID,分条大小=条带大小×(磁盘数-校验盘数))
示例:RAID5(5盘,1校验盘),条带大小64KB→分条大小=64KB×(5-1)=256KB。
三、课后选择题(含答案+解析)
关于软件RAID实现,以下哪项描述是正确的?A. 操作系统升级不需要验证与RAID软件的兼容性 B. 其成本高于硬件RAID实现 C. 支持所有RAID级别 D. 使用主机CPU周期执行RAID计算答案:D解析:软件RAID依赖主机CPU处理RAID运算(如XOR校验);A需验证兼容性,B成本低(无专用控制器),C仅支持基础级别(如RAID0/1)。
一个应用程序生成400个小型随机IOPS,读写比为3:1。用RAID 5的磁盘总负载IOPS是多少?A. 400 B. 500 C. 700 D. 900答案:C解析:读IOPS=400×3/4=300,写IOPS=100;RAID5写1次=4次IO→总负载=300 + 100×4=700。
用于小型随机I/O的RAID 6配置中的写性能损失是多少?A. 2 B. 3 C. 4 D. 6答案:D解析:RAID6写1次需“读旧数据+读2个旧校验+写新数据+写2个新校验”,共6次IO,写性能损失为6。
以下哪个应用程序可通过使用RAID 3获得最大效益?A. 备份 B. OLTP C. 电子商务 D. 电子邮件答案:A解析:RAID3是字节级分条+专用校验盘,适合大型顺序I/O(如备份数据连续读写);B/C/D是小型随机I/O,适合RAID5/10。
一个具有64 KB条带大小且包含五个磁盘的奇偶校验RAID 5集的分条大小是多少?A. 64 KB B. 128 KB C. 256 KB D. 320 KB答案:C解析:RAID5有1个校验盘,有效数据盘=5-1=4;分条大小=条带大小×有效盘数=64KB×4=256KB。
第四章 智能存储系统
一、核心知识点
智能存储系统(ISS)定义:功能丰富的RAID阵列,含缓存、多I/O路径,支持SSD、虚拟化调配,优化I/O处理。
ISS核心组件
前端:连主机的接口(FC/iSCSI口)、控制器(处理I/O请求)。
缓存:临时存储热点数据,提升性能;核心机制:
读操作:命中(直接返回)、未命中(读磁盘+存缓存),读命中率衡量性能。
写操作:透写(先写磁盘再确认,安全)、回写(先确认再写磁盘,快,需防掉电)。
管理算法:LRU(删久未访问)、MRU(删常访问);水位线(空闲刷新、高水位刷新、强制刷新)。
数据保护:缓存镜像(双存储卡存数据)、缓存保管(掉电转储到专用盘)。
后端:连物理磁盘的接口、控制器,管理RAID。
存储资源调配
传统调配:LUN与物理磁盘绑定,容量固定(如分100GB,用不完也占资源)。
虚拟调配(精简配置):LUN显示大容量(如10TB),实际用多少分配多少(如初始3TB),提高资源利用率。
LUN扩展:MetaLUN(合并:仅扩容量;分条:扩容量+性能)。
ISS类型:高端(活动-活动,多路径I/O,适合大企业)、中端(活动-被动,单路径I/O,适合中小企业)。
二、计算考点
无
三、课后选择题(含答案+解析)
在传统存储资源调配中,哪个LUN扩展技术可改进性能?A. 合并metaLUN B. 分条metaLUN C. 基础LUN D. 组件LUN答案:B解析:分条metaLUN将多个LUN分条,并行读写→提升性能;合并仅扩容量,不提升性能。
哪个进程通过限制主机对特定LUN的访问来提供数据访问控制?A. LUN 掩蔽 B. 分区 C. 主动变更 D. VSAN答案:A解析:LUN掩蔽定义“主机可访问的LUN”,防止未授权访问;B是FC SAN的逻辑分组,D是虚拟SAN。
哪个机制提供对“缓存中的未提交数据”的电源故障保护?A. 镜像 B. 缓存保管 C. 水位线 D. 分层答案:B解析:缓存保管在掉电时将未提交数据转储到专用“保险存储驱动器”,电源恢复后恢复;A防缓存故障,C是缓存刷新策略,D是存储分层。
第五章 光纤通道存储区域网(FC SAN)
一、核心知识点
FC SAN定义:服务器与共享存储的高速专用网络,数据块级共享,适合核心业务(如数据库)。
FC SAN组件
节点端口:HBA卡(服务器)、前端适配器(存储),双工链路(Tx/Rx)。
缆线:铜缆(30米内)、光纤(单模:10km,长距;多模:短距,成本低)。
连接器:SC(方型,交换机)、LC(双工,小型)、ST(圆形,旧式)。
互连设备:集线器(FC-AL,共享带宽,最多126节点)、交换机(FC-SW,专用路径,可扩展)、导向器(高端交换机,冗余组件)。
FC互连选项
点到点:直接连接,DAS用。
FC-AL(仲裁环):共享环,1次1设备I/O,节点变动暂停通信。
FC-SW(交换结构):交换机互连,专用路径,节点变动不影响。
FC协议栈(5层)
层级
名称
功能
FC-4
协议映射
将SCSI/IP映射到FC(如FCP=SCSI over FC)
FC-3
通用服务
未实施
FC-2
成帧/流控
帧结构、FC寻址、流控(信用机制)
FC-1
编码/解码
8b/10b(旧)、64b/66b(新)编码
FC-0
物理层
介质、缆线、连接器
FC寻址
FC地址:24位,含域ID(交换机唯一,239个)、区域ID(256个)、端口ID(256个)→总设备数≈1500万。
WWN(全球通用名):64位唯一标识,WWNN(节点)、WWPN(端口),类似MAC地址。
分区:逻辑分组节点,限制RSCN通信(减少广播风暴)、提供访问控制;类型:WWN分区(按设备WWN)、端口分区(按交换机端口)、混合分区。
二、计算考点
无
三、课后选择题(含答案+解析)
哪种缆线可在远距离时提供最小的信号衰减?A. 双绞铜线 B. 同轴铜线 C. 单模光纤 D. 多模光纤答案:C解析:单模光纤仅传1条光束,信号衰减最小,支持10km+;多模传多光束,短距衰减小,长距衰减大;铜线衰减大,短距用。
什么是FC SAN 中的F_Port?A. 连接E_Port 的交换机端口 B. 连接N_Port 的交换机端口 C. 连接N_Port 的节点端口 D. 连接E_Port 的节点端口答案:B解析:FC端口定义:N_Port(节点端口,服务器/存储)、F_Port(交换机端口,连N_Port)、E_Port(交换机端口,连其他交换机,ISL链路)。
哪种类型的连接结构登录支持在N_Port 之间交换与上层协议相关的参数?A. 连接结构登录 B. 端口登录 C. 进程登录 D. ULP 登录答案:C解析:登录类型:FLOGI(N→F,获FC地址)、PLOGI(N→N,建立会话)、PRLI(N→N,交换ULP参数,如SCSI协议参数)。
FC SAN 中分区的优点有哪些?A. 共享连接结构服务 B. 限制RSCN 通信 C. 支持在线卷扩展 D. 提供无中断数据迁移答案:B解析:分区将节点分组,仅组内通信,限制RSCN(状态变更通知)广播范围;A/C/D与分区功能无关。
VSAN 的优点是什么?A. 不再需要连接结构登录进程 B. 提供的网络带宽更高 C. 通过分隔VSAN 之间的通信提高安全性 D. 使VSAN 能够共享连接结构分区服务答案:C解析:VSAN是FC SAN上的逻辑结构,各VSAN独立(服务/配置/地址),分隔通信→提高安全性;A仍需登录,B带宽不变,D不共享分区服务。
第六章 IP SAN和FCoE
一、核心知识点
IP SAN定义:基于IP网络传输数据块,核心协议iSCSI(SCSI over IP)、FCIP(FC over IP),成本低(复用现有IP网络)。
iSCSI核心组件
启动器(Initiator):服务器端,如iSCSI HBA卡(卸载CPU)、TOE NIC(卸载TCP)、软件启动器(依赖CPU)。
目标(Target):存储端,如iSCSI端口、iSCSI网关(连FC存储)。
拓扑:本机iSCSI(直连存储)、桥接iSCSI(iSCSI网关连FC存储)。
iSCSI关键技术
协议栈:应用层(SCSI)→会话层(iSCSI)→传输层(TCP)→网络层(IP)→数据链路层(以太网)。
发现:SendTargets(手动配目标IP)、iSNS(注册到服务器,自动发现)。
名称:iqn(需注册域名,如iqn.2024-nwpu:storage1)、eui(IEEE EUI-64,如eui.0300732A32598D26)。
FCIP协议:FC帧封装到IP包,连接分布式FC SAN(如北京-上海灾备),提供长距传输。
FCoE(以太网光纤通道)
定义:FC帧封装到以太网帧,整合FC和以太网(1张CNA卡+1条线),降成本、简化管理。
组件:CNA卡(整合NIC+FC HBA)、FCoE交换机(含FCF转发器,封装/解封装FC帧)、CEE(聚合增强以太网,无损耗)。
CEE核心功能:PFC(基于优先级流控,独立暂停虚拟链路)、ETS(带宽分配)、CN(拥挤通知)、DCBX(配置同步)。
二、计算考点
无
三、课后选择题(含答案+解析)
哪个iSCSI 主机连接选项可从主机CPU 分流iSCSI 和TCP/IP 处理的负载?A. 具有iSCSI 启动器软件的标准NIC B. TOE NIC C. iSCSI HBA D. CNA答案:C解析:iSCSI HBA卡同时卸载iSCSI和TCP/IP处理;A依赖CPU,B仅卸载TCP,D是FCoE组件。
哪种类型的iSCSI 名称需要注册域名才能生成唯一iSCSI 标识符?A. eui B. iqn C. WWN D. MAC答案:B解析:iqn格式为“iqn.年份-机构域名:自定义”,需注册域名(如nwpu.edu.cn);eui基于IEEE EUI-64,无需注册。
哪个协议可将FC 帧封装到IP 数据包?A. FCoE B. iSCSI C. FCIP D. CIFS答案:C解析:FCIP是“FC over IP”,封装FC帧到IP包;A是FC over以太网,B是SCSI over IP,D是NAS文件协议。
下面哪一项是基于优先级的流控制的特点?A. 虚拟链路可独立暂停 B. 所有虚拟链路一起暂停 C. 实现基于带宽暂停虚拟链路 D. 实现基于优先级暂停单个物理链路答案:A解析:PFC在1条物理链路上创建8个虚拟链路,每个可独立暂停/重启;B是传统以太网暂停,C是ETS功能,D暂停虚拟链路而非物理链路。
哪项功能允许将带宽分配给FCoE 环境中的不同通信类别?A. 基于优先级的流控制 B. 增强传输选择 C. 拥挤通知 D. 数据中心桥接交换答案:B解析:ETS将带宽分配给LAN/SAN/IPC等类别,闲置带宽可共享;A是流控,C是拥挤预警,D是配置同步。
第七章 网络连接存储(NAS)
一、核心知识点
NAS定义:基于IP的专用文件共享设备,支持CIFS(Windows)、NFS(Linux)协议,适合文件共享(如运营报表、视频素材)。
NAS核心组件:NAS机头(含OS、文件系统、网络接口)、存储阵列(存数据)、网络接口(以太网)。
NAS与通用服务器区别:NAS是单一用途(仅文件共享),OS优化(轻量,无冗余功能);通用服务器多用途(跑APP+文件共享),资源占用高。
NAS文件共享协议
CIFS:有状态(维护连接信息),支持自动恢复连接、文件锁定,Windows用。
NFS:NFS v2/v3无状态(UDP/TCP),v4有状态(TCP),Linux用。
NAS实施方式
统一NAS:整合NAS(文件)+SAN(数据块),支持CIFS/NFS/iSCSI/FC,统一管理。
网关NAS:NAS机头连外部存储(如FC SAN),机头与存储独立管理。
横向扩展NAS:多节点集群,单文件系统,扩展容量+性能(如添加节点,容量从10TB→50TB)。
文件级虚拟化:消除文件访问与物理位置的关联,用全局命名空间(逻辑路径)访问,支持无中断数据迁移。
二、计算考点
无
三、课后选择题(含答案+解析)
NAS 机头的哪种组件会将文件级请求转换为数据块存储请求?A. 前端端口 B. 经过优化的操作系统 C. CIFS 和NFS D. 网络接口卡答案:B解析:NAS机头的优化OS负责协议转换(CIFS/NFS文件请求→数据块I/O请求);A是连主机端口,C是文件协议,D是网络接口。
哪项是横向扩展NAS 的功能?A. 将一般用途操作系统用于文件服务 B. 在群集中的每个节点上创建多个文件系统 C. 使用外部、单独进行管理的节点 D. 支持共用作为单个NAS 设备工作的节点答案:D解析:横向扩展NAS将多节点集群为“单个NAS设备”,单文件系统;A用优化OS,B单文件系统,C节点统一管理。
哪项是网关NAS 的功能?A. 对每个NAS 机头使用专用存储 B. NAS 机头和存储是单独进行管理的 C. 创建在所有NAS 机头上运行的单个文件系统 D. 提供iSCSI 和FC 主机连接答案:B解析:网关NAS的机头(管文件)与外部存储(管数据块)独立管理;A是统一NAS,C是横向扩展NAS,D是统一NAS功能。
哪种NAS 实施会整合对单个存储平台的基于文件和基于数据块的访问?A. 横向扩展 B. 网关 C. 统一 D. 网关和横向扩展答案:C解析:统一NAS的核心是“文件(NAS)+数据块(SAN)”整合访问,支持多协议;A/B仅支持文件或需外部存储。
哪一项是文件级虚拟化的优势?A. 使用户能够使用物理路径(而不是逻辑路径)访问文件 B. 无中断地将文件级请求转换为数据块存储请求 C. 整合对单个存储平台的基于NAS 和基于SAN 的访问 D. 消除了在文件级访问的数据与文件位置之间的相关性答案:D解析:文件级虚拟化用逻辑路径访问,消除“访问路径-物理位置”关联,支持无中断迁移;A用逻辑路径,B是NAS OS功能,C是统一NAS功能。
第八章 基于对象的存储和统一存储
一、核心知识点
基于对象的存储定义:以“对象”为单位存储非结构化数据(如视频/图片),对象含数据+元数据+唯一对象ID(哈希生成),单一地址空间(无目录层级)。
对象存储核心组件(OSD)
OSD节点:智能设备(CPU+存储+网络),管理本地对象。
元数据服务:存储对象ID、元数据,负责对象定位。
内部网络:连接OSD节点,传输数据。
对象存储流程
存储:应用→OSD节点(拆分数据/元数据)→生成对象ID→元数据服务存元数据/ID→存储服务存数据。
检索:应用→元数据服务(查对象ID)→OSD节点(用ID取数据)→返回应用。
内容寻址存储(CAS):专为固定内容(如用户认证照片、合同)设计,生成唯一内容地址(CA,基于数据二进制),防篡改、单实例存储。
统一存储
定义:整合数据块(SAN)、文件(NAS)、对象(OSD)访问,单平台+单管理界面,降成本、简化管理。
组件:存储控制器(数据块)、NAS机头(文件)、OSD节点(对象)、存储池(共享存储资源)。
数据访问:数据块请求→存储控制器;文件请求→NAS机头→存储控制器;对象请求→OSD节点→存储控制器。
二、计算考点
无
三、课后选择题(含答案+解析)
单一地址空间较层次结构地址空间而言有何优势?A. 高度可扩展且对性能影响最小 B. 根据保留策略提供对数据的访问 C. 使用同一接口提供对数据块、文件和对象的访问 D. 访问数据时使用的网络带宽更少答案:A解析:单一地址空间(对象存储)无目录层级,支持百万级对象存储,可扩展性高;B是CAS功能,C是统一存储功能,D与地址空间无关。
OSD 节点中的元数据服务有何作用?A. 负责以对象的形式存储数据 B. 存储为对象生成的唯一ID C. 存储对象和对象ID D. 控制存储设备的功能答案:B解析:元数据服务专门存储对象的元数据和唯一ID;A是存储服务功能,C对象由OSD节点存储,D是OSD节点控制器功能。
使用下面哪一项在CAS 系统中生成对象ID?A. 文件元数据 B. 源和目标地址 C. 数据的二进制表示形式 D. 文件系统类型和所有权答案:C解析:CAS的对象ID(CA)基于数据二进制内容生成(如哈希值),内容不变则ID不变,确保完整性;A/B/D与CAS ID生成无关。
下面哪一项准确描述了统一存储中的数据块I/O 访问?A. I/O 穿过NAS 机头和存储控制器到达磁盘 B. I/O 穿过OSD 节点和存储控制器到达磁盘 C. I/O 穿过存储控制器到达磁盘 D. I/O 会直接发送到磁盘答案:C解析:统一存储中,数据块请求(如iSCSI/FC)直接经存储控制器到磁盘;A是文件I/O路径,B是对象I/O路径,D无控制器调度。
下面哪一项准确描述了统一存储?A. 在一个平台中提供数据块、文件和基于对象的访问 B. 使用对象提供数据块和文件存储访问 C. 使用单一地址空间支持数据块和文件访问 D. 专门构建用于归档的专用存储设备答案:A解析:统一存储的核心是“三合一”(数据块+文件+对象);B用对象中转,C是对象存储特征,D是CAS功能。
第九章 业务连续性简介
一、核心知识点
业务连续性(BC)定义:应对系统中断(灾难/故障/计划内维护),确保业务快速恢复的流程,含预防性(冗余)和应对性(恢复)措施。
信息可用性(IA)指标
MTBF(平均无故障时间):总正常运行时间/故障次数→衡量可靠性。
MTTR(平均修复时间):总宕机时间/故障次数→衡量可维护性。
可用性公式:**IA = MTBF / (MTBF + MTTR)**,如MTBF=7500h,MTTR=3h→IA≈99.96%。
可用性级别(几个9):99.99%→年宕机52分钟,99.999%→年宕机5分钟。
BC关键术语
RPO(恢复点目标):中断后可接受的数据丢失量(如2小时→最多丢2小时数据)。
RTO(恢复时间目标):中断后业务恢复的最长时间(如30分钟→30分钟内恢复)。
BC技术解决方案
消除单点故障:冗余组件(双交换机、NIC分组、冗余存储端口)。
多路径软件:识别备用I/O路径,负载平衡(分散I/O)、故障切换(路径断了自动切)。
二、计算考点(高频)
可用性计算
示例:系统周一至周五8:00-17:00运行,周四13:00-19:00故障(宕机6小时,其中工作时间3小时)→总工作时间=5天×9h=45h,正常运行时间=45-3=42h→IA=42/45≈93.3%。
MTBF/MTTR计算
示例:组件周二5:00-7:00(2h)、周四16:00-20:00(4h)、周五8:00-11:00(3h)故障→总宕机时间=2+4+3=9h,故障次数=3→MTTR=9/3=3h;总正常运行时间=(7天×24h)-9=159h→MTBF=159/3=53h。
三、课后选择题(含答案+解析)
如果应用程序的恢复点目标(RPO) 为2 小时,则以下哪项陈述正确?A. 应用程序继续运行所需的时间必须短于2 小时 B. 应用程序继续运行所需的时间必须等于2 小时 C. 不超过2 小时的生产数据可能会丢失 D. 两次应用程序故障之间的平均时间为2 小时答案:C解析:RPO是“可接受的数据丢失量”,2小时RPO→最多丢2小时数据;A/B是RTO定义,D是MTBF定义。
以下哪项配置允许对两个或多个物理NIC 进行分组并将它们视为一台逻辑设备?A. NIC 流 B. NIC 移植 C. NIC 分组 D. NIC 分区答案:C解析:NIC分组(如Linux bonding)将多物理NIC→1逻辑NIC,冗余+负载平衡;A/B/D无此功能定义。
以下哪项最恰当地描述了恢复时间目标(RTO)?A. 中断之后必须将数据恢复到的时间点 B. 两次故障之间系统或组件可执行其正常操作的时间 C. 一段时间,系统和应用程序在中断后必须在此期间恢复 D. 企业可承担的数据丢失量答案:C解析:RTO是“恢复时间上限”;A是RPO定义,B是MTBF定义,D是RPO定义。
以下哪个表达式可从MTBF 和MTTR 方面表示系统的可用性?A. MTTR/(MTBF x MTTR) B. MTBF/(MTBF x MTTR) C. MTTR/(MTBF + MTTR) D. MTBF/(MTTR + MTBF)答案:D解析:可用性=正常运行时间/(正常运行时间+宕机时间)=MTBF/(MTBF+MTTR),对应选项D。
某部门要求能够在周一至周五的每天上午9 点至下午5 点访问数据库应用程序。上周四下午1 点应用程序崩溃,花了6 个小时才解决问题。应用程序在上周的可用性是多少?A. 85% B. 90% C. 95% D. 100%答案:B解析:总工作时间=5天×8h=40h;宕机时间=6h(其中工作时间4h:13:00-17:00);正常运行时间=40-4=36h;IA=36/40=90%。
第十章 备份和归档
一、核心知识点
备份定义:创建生产数据的额外拷贝,用于恢复丢失/损坏数据,目的:灾难恢复、操作恢复、归档。
备份粒度(高频考点)
类型
定义
优点
缺点
恢复方式
完整备份
备份所有数据
恢复快(仅需完整备份)
慢、占空间
直接用完整备份
增量备份
备份上次备份(任何类型)后变更的数据
快、省空间
恢复慢(完整+所有增量)
完整备份+依次恢复增量
累积备份
备份上次完整备份后变更的数据
恢复较快(完整+最新累积)
比增量慢、占空间
完整备份+最新累积备份
备份方法
热备份(在线):备份时APP运行,用打开文件代理备份正在使用的文件,适合核心业务。
冷备份(离线):备份时关APP,数据绝对一致,适合非核心业务。
裸机恢复:备份OS+硬件+APP配置,支持完整系统恢复。
备份拓扑:基于LAN(数据经LAN传,占带宽)、基于SAN(数据经SAN传,不占LAN)、直连(直接连备份设备)。
备份目标对比
目标
优点
缺点
适用场景
磁带
成本低、适合归档
顺序访问、慢、易磨损
长期归档
磁盘
随机访问、快、可靠
成本高
短期备份、核心业务
虚拟磁带
模拟磁带、快、可靠
仅用于备份
替代物理磁带
重复数据删除:消除冗余数据,降低存储/带宽成本;类型:
方法:文件级(单实例存储)、子文件级(固定/可变长度块)。
实施:基于源(备份前删冗余,省带宽)、基于目标(备份后删冗余,省存储)。
数据归档:存储固定内容(如旧视频、合同),满足合规;介质:在线(磁盘,快)、近线(磁带库,需装载)、离线(磁带,手动干预);解决方案:CAS(防篡改、单实例)。
二、计算考点
无
三、课后选择题(含答案+解析)
关于增量备份,以下哪项是正确的?A. 恢复只需上次完整备份和上次增量备份 B. 恢复只需上次增量备份 C. 复制自从上次完整备份或增量备份以来有更改的数据 D. 复制自从上次完整备份以来有更改的数据答案:C解析:增量备份备份“上次任何备份后”的变更数据;A需完整+所有增量,B需完整备份,D是累积备份定义。
虚拟化环境中基于映像的备份与传统备份方法相比有何优势?A. 减轻虚拟机管理程序的备份处理负担 B. 更快,因为它仅复制虚拟机磁盘数据 C. 更快,因为它仅复制虚拟机配置数据 D. 所需的空间是整个备份数据的一小部分答案:A解析:基于映像的备份在代理服务器上处理,不占用虚拟机管理程序资源;B/C复制完整映像(磁盘+配置),D空间与传统相当。
以下哪一项准确描述了备份服务器的角色?A. 收集要备份的数据并将其发送到存储节点 B. 负责将客户端发送的数据写入备份设备 C. 管理备份操作和维护备份目录 D. 控制磁带库中的机械臂答案:C解析:备份服务器核心是“管理+目录”(调度备份、记录备份元数据);A是备份客户端角色,B是存储节点角色,D是存储节点功能。
在磁带备份环境中,"来回走带"是什么意思?A. 从多数据流将数据写入单一磁带 B. 模拟磁盘驱动器并作为磁带提供给备份软件的过程 C. 当备份数据流中断时磁带机进行的重复的往复移动 D. 删除备份数据中冗余内容的过程答案:C解析:“来回走带”是磁带机因数据流中断,反复移动磁带寻找数据,导致性能下降;A是多数据流写入,B是虚拟磁带,D是重复数据删除。
基于源的重复数据删除有何优势?A. 提高了备份客户端的性能 B. 提高了备份服务器的性能 C. 将备份时段减至零 D. 减少了备份的网络带宽需求答案:D解析:基于源的重复数据删除在备份客户端删除冗余数据,仅传唯一数据→省网络带宽;A会占用客户端CPU(性能下降),B与服务器无关,C备份时段不会为零。
第十一章 本地复制
一、核心知识点
本地复制定义:同一数据中心内创建数据副本,用于快速恢复(如逻辑损坏)、测试、备份源。
复制副本核心要求
一致性:文件系统(刷新主机缓冲区)、数据库(按事务顺序复制)。
时间点(PIT):副本对应特定时间点(如10:00),支持恢复到该时间点。
本地复制技术(高频考点)
类型
实施位置
原理
优点
缺点
适用场景
基于主机的复制
主机
LVM镜像(实时复制)、文件系统快照(CoFW)
部署简单
占主机CPU
小容量数据(日志)
基于阵列的复制
存储阵列
完整卷镜像(实时)、基于指针的复制(CoFW)
不占主机资源
依赖阵列功能
大容量数据(数据库)
基于网络的复制(CDP)
主机-存储之间
写操作拆分→日志卷,支持任意PIT恢复
任意时间点恢复
需额外设备(CDP应用装置)
核心业务(零数据丢失)
这页PPT在讲**“基于主机的LVM镜像复制技术”**,核心是解释它的**工作原理、性能影响和局限性**,我用通俗的逻辑帮你拆解:
1. 什么是“基于LVM的镜像”?
LVM(逻辑卷管理)是主机里的一种磁盘管理技术。“基于LVM的镜像”就是:
主机里的**逻辑卷**(可以理解为“虚拟的磁盘分区”),会把每个数据块**同时复制到两个物理磁盘**(即“物理卷1”和“物理卷2”)上。
类比:你保存一个文件,系统会同时把文件存到“硬盘A”和“硬盘B”里,相当于实时做了一份备份。
2. 它是怎么工作的?(对应“逻辑块映射到两个物理块”)
逻辑卷的每个数据块,都会在**两个物理磁盘**(物理卷1、2)上各存一份。比如你往逻辑卷里写1个文件,这个文件会同时出现在“硬盘A”和“硬盘B”里——这就是“镜像复制”的实现。
3. 有什么缺点?
性能损耗:“对CPU施加额外负荷,降低应用性能”
因为写数据时要同时写两个磁盘,主机的CPU得干“双倍的活”,所以应用程序(比如数据库、办公软件)的运行速度会变慢。
防故障能力弱:“副本和源在同一卷组,主机故障时都不可用”
LVM的“卷组”是在**同一台主机**里的。如果主机本身坏了(比如主板故障、整机宕机),那么“源数据”和“镜像副本”都在这台主机里,会一起不可用。
换句话说,它只能防**单个物理磁盘的故障**(比如硬盘A坏了,硬盘B还能用),但**防不了主机级的故障**(比如主机整机报废)。
通俗例子辅助理解
把主机想象成“你的电脑”,物理卷1、2是“电脑里的两个硬盘”:
每次存文件,系统会同时把文件存到“硬盘A”和“硬盘B”里(镜像复制);
坏处1:存文件要写两次,电脑CPU会更忙,导致你用软件时更卡(性能降低);
坏处2:如果电脑整机坏了(比如主板烧了),两个硬盘里的文件都跟着废了,所以这种复制只能防“硬盘坏”,防不了“电脑坏”。
总结:这页PPT的核心是告诉你——**基于主机LVM的镜像复制,能实时备份磁盘数据,但会拖累主机性能,且不能应对主机级的故障**。
这张PPT讲的是**“文件系统快照”的工作原理**,它是一种基于主机的本地数据复制技术,核心是**“只复制变化的数据,大幅节省存储空间”**。以下用通俗逻辑和例子拆解:
1. 核心角色:“生产FS”和“FS快照”
生产FS(左边框):是正在运行的业务系统的文件系统(比如你电脑里的C盘),包含“元数据”(记录文件位置、属性的信息)和各种“数据块”(比如文件a、b、c、d……)。
FS快照(右边框):是生产FS在**某个时间点的“数据快照”**,相当于给文件系统拍了一张“时间照片”,但它不是全量复制,只存“变化的部分”。
2. 关键技术:“第一次写入时拷贝(CoFW)”
当生产FS里的数据被修改时,系统会先把**“修改前的原始数据”复制到快照里**,再在生产FS中写入新数据。
举个例子:
生产FS里的“数据C”要被改成“数据c’”,系统会先把**原始的“数据C”**复制到快照空间,再在生产FS里写“数据c’”。
这样,快照里保留了“修改前的C”,生产FS里是“修改后的c’”——既保证快照能还原旧数据,又不影响业务正常写入。
3. 如何跟踪数据?——“位图”和“块图”
位图:记录“哪些数据块在快照之后被修改过”(比如图中“位3-1、4-1”,表示数据块3、4被修改了)。
块图:记录“快照里的原始数据存在哪个位置”(比如图中“BLK3-2”,表示数据块3的原始数据存在快照的“3-2”位置)。
当需要恢复快照时,系统通过“位图”知道“哪些块被改了”,再通过“块图”找到“快照里的原始数据”,就能还原出某个时间点的完整文件系统。
4. 优点:“省空间”
因为只复制“变化的数据”,所以快照只需要“生产FS所用空间的一小部分”,非常节省存储资源。
通俗例子辅助理解
把“生产FS”想象成你的手机相册,“FS快照”就是某一时刻的相册备份:
平时相册里的照片会新增/删除(数据变化);
当你第一次修改某张照片(比如P图),系统会先把“P图前的原图”存到快照空间,再保存P图后的新照片;
“位图”就像“记录哪些照片被P过”的清单,“块图”就像“原图存在哪个文件夹”的地图;
这样,你随时可以通过快照还原出“P图前的相册状态”,且因为只存了变化的“原图”,非常省空间。
总结:这张图的核心是解释**文件系统快照如何通过“只复制变化数据+指针/位图/块图跟踪”的方式,实现高效的本地数据复制和时间点还原**,既省空间又不影响业务运行。
这张图讲解的是**“完整卷镜像”的工作机制**,属于存储阵列级的本地复制技术,核心是通过“镜像卷”实现数据备份或容灾,分为两个阶段理解:
1. 上方“已连接”阶段:实时同步镜像
生产主机:正常读写“源卷”(业务数据的存储卷)。
存储阵列:将“源卷”的所有数据**实时复制到“目标卷”**,相当于给源卷做了一份“实时备份”。
BC主机(备份/容灾主机):此时“目标卷”处于“未就绪”状态——因为还在同步过程中,BC主机暂时无法访问它。
2. 下方“断开 - PIT(时间点)”阶段:镜像卷独立可用
当需要使用镜像卷时,**源卷和目标卷的复制关系被断开**。
此时“目标卷”成为“源卷”在**某个时间点(PIT)的完整镜像副本**,BC主机可以对其进行“读/写”操作(比如用于数据恢复、业务临时切换)。
通俗类比
把“源卷”想象成你正在编辑的Word文档,“目标卷”是它的“实时备份副本”:
已连接阶段:你每打一个字,备份副本就同步更新,但此时备份副本是“锁定”的,别人不能编辑;
断开 - PIT阶段:你主动停止同步,备份副本就变成“某一时刻的文档快照”,别人可以打开它编辑、恢复数据。
总结:这张图展示了**存储阵列如何通过“完整卷镜像”技术,先实时同步数据,再在需要时断开形成“时间点镜像副本”**,用于数据备份或业务容灾。
这部分内容讲的是**“基于指针的完整卷复制”技术**,核心是通过“第一次访问时才拷贝数据”的策略,实现高效的卷级数据复制(常用于备份、容灾或测试)。以下分**核心概念、两种复制模式、三张场景图**逐一拆解:
一、核心概念
“基于指针的完整卷复制”是存储阵列级的复制技术,目标是在**目标设备**上生成**源数据的完整拷贝**,但不是“一开始就全量复制”,而是通过**指针跟踪**和**“第一次访问时拷贝”**的策略,按需复制数据,从而节省时间和IO资源。
关键特性:
目标设备容量需**至少与源设备相同**(因为是完整拷贝)。
复制会话激活后,**BC主机(备份/容灾主机)可立即访问目标设备**,但此时目标并非完整数据,而是通过“保护位图”跟踪源的变化。
PIT(时间点) 由“会话激活时间”决定(即复制开始时的源数据快照)。
二、两种复制模式
完整拷贝模式:
会话启动后,后台**全量复制源的所有数据到目标**(类似“一次性把整本书抄完”),是传统的全量复制逻辑。
第一次访问时拷贝(延迟拷贝):
核心是**“按需拷贝”**——只有当“源或目标被读/写访问”时,才将对应数据块从源拷贝到目标(类似“有人要看/写某页,才把这页从原书抄到副本”)。这是重点,以下结合三张图详细解释。
三、场景图拆解(第一次访问时拷贝)
1. 写入源(生产主机写源卷)
场景:生产主机向**源卷**写入新数据 C’。
过程:
因为是“复制会话激活后第一次写源”,系统会先把**源卷中该地址的原始数据 C 拷贝到**目标卷**,然后再在源卷中写入 C’。
目的:保证目标卷中保留“会话激活时的原始数据 C”,即PIT时间点的快照。
类比:你要在“原日记(源)”写新内容 C’,系统会先把“原日记里没写 C’ 之前的 C 页”抄到“副本日记(目标)”,再在原日记写 C’。这样副本里永远有“没写 C’ 时的 C 页”。
2. 写入目标(BC主机写目标卷)
场景:BC主机(备份/容灾主机)向**目标卷**写入新数据 B’。
过程:
系统会先把**源卷中的原始数据 B 拷贝到目标卷,然后再在目标卷中写入 B’。
目的:保证目标卷在写入新数据时,仍保留“会话激活时的原始数据 B”的快照逻辑。
类比:你要在“副本日记(目标)”写新内容 B’,系统会先把“原日记里的 B 页”抄到副本,再在副本写 B’。这样副本的 B 页变成 B’,但原日记的 B 页还是原来的,副本里保留了“抄的时候的 B 页”。
3. 从目标读取(BC主机读目标卷)
场景:BC主机读取**目标卷**的数据 A。
过程:
系统会先把**源卷中的原始数据 A 拷贝到目标卷,然后供BC主机读取。
注意:“目标上的数据无法用于恢复”——因为这种“按需拷贝”是逐步进行的,若源卷故障,目标卷可能只有部分数据(比如只抄了 A 页,其他页还没抄),因此它**不适合作为“完整恢复源卷”的备份**,更多用于测试、临时容灾等场景。
类比:你要读“副本日记(目标)”的 A 页,系统会先把“原日记里的 A 页”抄到副本,然后你读副本的 A 页。但如果原日记丢了,副本可能只有 A 页,其他页没抄,所以没法用副本恢复完整的原日记。
总结
“基于指针的完整卷复制(第一次访问时拷贝)”是一种**高效的按需复制技术**,通过“访问时才拷贝数据”避免了全量复制的开销,适合对“实时性要求不高、或用于测试/临时容灾”的场景,但不适合作为“完整恢复源数据”的备份方案(因为数据是逐步拷贝的,可能不完整)。
“基于指针的完整卷复制”和“完整卷镜像”的不同
要清晰区分**“基于指针的完整卷复制”**和**“完整卷镜像”**,可以从**复制机制、数据一致性、可用性、应用场景**等维度逐一对比:
对比维度 | 完整卷镜像 | 基于指针的完整卷复制(第一次访问时拷贝) |
复制时机 | 实时同步:源卷有写操作时,立即同步到目标卷,是“全量实时复制”。 | 按需复制:仅在**第一次访问(读或写)某数据块**时,才将该数据块从源卷拷贝到目标卷,是“按需增量复制”。 |
数据一致性 | 断开复制关系后,目标卷是源卷在“时间点(PIT)”的**完整、一致副本**(所有数据块都已同步)。 | 目标卷是**逐步构建**的:未被访问的数据块不会复制到目标,若源卷故障,目标卷可能只有部分数据,存在“数据不完整、不一致”的风险。 |
目标可用性 | 同步阶段目标卷“未就绪”(无法访问);断开后目标卷可**独立读写**,且数据完整一致。 | 复制会话激活后,目标卷**立即可访问**,但此时数据是“逐步填充”的(未访问的块无数据)。 |
应用场景 | 适合**容灾恢复**:源卷故障后,可直接用目标卷(完整一致副本)接管业务。 | 适合**测试、临时访问**(如开发环境验证数据):目标卷数据可能不完整,无法用于“源卷故障后的完整恢复”,但初始访问开销小。 |
资源开销 | 实时同步对存储IO、带宽开销大(需持续同步所有写操作)。 | 按需复制初始开销小(不用全量复制),仅在访问数据块时消耗资源,整体更节省IO和时间。 |
通俗类比理解
完整卷镜像:像“实时备份的U盘”,源文件改了就立即同步,拔下U盘后,U盘中的文件和源文件在“拔下时刻”完全一致,能直接用来恢复源文件。
基于指针的完整卷复制:像“按需下载的云盘”,只有当你要读/写某个文件时,才下载该文件到本地,云盘里的文件是逐步下载的,若源文件(云服务器上的文件)突然删除,本地可能只下载了部分文件,无法完全恢复源文件。
通过以上对比,你可以根据业务对“数据完整性、实时性、资源开销”的需求,选择更适合的技术:
若需要**完整、一致的容灾副本**(如核心业务数据恢复),选**完整卷镜像**;
若需要**快速启动复制、对资源开销敏感**(如测试环境临时用数据),选**基于指针的完整卷复制**。
“基于指针的虚拟复制”是一种**极度节省空间、按需复制数据**的本地复制技术,核心是“目标不存实际数据,只存指向数据位置的指针”。以下从**核心逻辑、场景拆解、适用价值**三方面帮你吃透:
一、核心概念拆解
“指针”的作用:目标设备里**没有实际数据**,只存“指向源设备数据位置的指针”。打个比方,目标就像“带目录的书签”,书签里记录着“某页数据在源卷的第几行第几列”,自身不存内容。
空间开销:因为只存指针,目标仅需源卷大小的**一小部分空间**(比如源卷1TB,目标可能只需几十GB存指针和少量拷贝的数据)。
访问实时性:复制会话一开始,目标设备就能被访问(因为指针是现成的,不用等全量数据复制)。
CoFW原则:和之前的文件系统快照类似,采用“**第一次写入时拷贝**”——只有当数据被修改时,才把“修改前的原始数据”拷贝到“保存位置”,保证目标指针始终能指向正确的历史数据。
适用场景:适合**源数据改动率低于30%** 的场景(比如核心数据库,日常改动少,大部分数据还是原始状态)。
二、场景图详解
1. 写入源(生产主机向源卷写数据)
场景:生产主机向**源卷**写入新数据 C’。
过程:
① 系统先把源卷中该地址的**原始数据 C 拷贝到“保存位置”;
② 更新目标虚拟设备的**指针**,让它指向“保存位置里的原始数据 C”;
③ 最后才在源卷中写入新数据 C’。
目的:保证目标的指针始终能指向“写入前的原始数据 C”,即保留了某一时刻的历史快照。
类比:你在“原书(源卷)”的某页写新内容前,先把“原页(原始数据 C)”复印到“存档册(保存位置)”,然后在原书改内容。“目标虚拟设备”的书签(指针)就从“原书某页”改成“存档册某页”,这样随时能通过书签找到“改前的原页”。
2. 写入目标(BC主机向目标虚拟设备写数据)
场景:BC主机(备份/容灾主机)向**目标虚拟设备**写入新数据 A’。
过程:
① 先把源卷中的**原始数据 A 拷贝到“保存位置”;
② 更新目标虚拟设备的指针,让它指向“保存位置里的原始数据 A”;
③ 在“保存位置”里再复制一份原始数据 A(防止后续改动覆盖),然后写入新数据 A’;
④ 目标读数据时,是“源卷没改动的数据(如 B、C’)” + “保存位置改动后的数据(如 A’)”的组合。
目的:既保证目标能访问历史原始数据,又支持对目标的写入操作,同时不破坏源数据的完整性。
类比:你在“书签(目标指针)”对应的“存档册某页(原始数据 A)”上写新内容前,先复印一份“存档册的原页”,再在复印页写新内容。这样书签还是能指向“存档册的原页”,同时你也有了“写过新内容的复印页”,读的时候两者结合就能得到完整逻辑。
三、技术价值总结
极致省空间:目标只存指针,不用全量复制数据,适合大规模存储场景。
访问零等待:会话启动后目标立即可用,不用等漫长的全量复制。
数据可追溯:通过CoFW和保存位置,能随时找回“某一时刻的原始数据”,满足备份、审计需求。
适用场景:核心业务系统(如数据库)且日常改动少(改动率<30%)的场景,既能省资源,又能保证数据可恢复。
简单来说,“基于指针的虚拟复制”是个“**用书签管理数据,按需复印历史页**”的聪明技术——既省空间、又能快速访问,还能追溯历史数据,非常适合对存储成本和恢复时效都有要求的核心业务场景。
基于指针的复制核心原理(CoFW:第一次写入时拷贝)
源写入:先将旧数据拷到副本“保存位置”,再改源数据→副本保留旧数据。
副本写入:先将源旧数据拷到“保存位置”,再改副本→副本保留旧数据。
虚拟化环境复制
把 “镜像虚拟卷” 想象成 **“由多个不同品牌硬盘组装的‘智能虚拟硬盘’”**:
你(主机)只需要和这个 “虚拟硬盘” 交互;
背后的 “虚拟化应用装置” 负责把不同品牌的硬盘(存储阵列的 LUN)拼成这个 “虚拟硬盘”;
这个 “虚拟硬盘” 会自动把数据复制到多个物理硬盘(镜像分支),哪怕一个硬盘坏了,其他硬盘里的副本还能正常使用。
总结:“虚拟卷镜像” 通过存储虚拟化技术,将异构物理存储整合成虚拟卷后再做镜像复制,既实现了存储资源的灵活管理,又保证了数据的高可用性,是企业级存储容灾的重要技术之一。
虚拟卷镜像:虚拟化应用装置复制虚拟卷。
虚拟机快照:捕获PIT状态(系统+数据),恢复快。 简单来说,虚拟机快照就是给虚拟机 “存档”,随时能 “读档” 回到某个健康状态,是虚拟机容灾、测试的关键技术。
虚拟机克隆:复制完整VM,独立于源(测试用)。 简单来说,虚拟机克隆就是 “复制粘贴一台一模一样的虚拟机,且彼此独立不干扰”,是测试、批量部署场景下的高效解决方案。
二、计算考点
无
三、课后选择题(含答案+解析)
基于指针的虚拟复制有何优势?A. 源设备无需正常运行即可进行恢复 B. 无需保存位置即可激活会话 C. 创建复制副本所需的存储空间更少 D. 复制不会对源产生性能影响答案:C解析:基于指针的虚拟复制仅存指针和修改数据,副本空间是源的一小部分(如500TB源→50TB副本);A需源正常(指针指向源),B需保存位置,D会有轻微性能影响(CoFW操作)。
有关基于指针的完整卷复制,以下哪一项是正确的?A. 目标大小是源的一小部分 B. 目标大小至少与源大小相同 C. 仅在同步完成并从源上断开后才能进行访问目标 D. 目标始终只包含指向保存位置的指针答案:B解析:基于指针的完整卷复制是“完整拷贝”,目标需至少与源同大小;A是虚拟复制特征,C立即可访问,D包含完整数据(非仅指针)。
在连续数据保护技术中,以下哪项因素决定着恢复点可退回的时间范围?A. 为复制副本配置的空间量 B. 复制中使用的写操作拆分器的类型 C. 为日志配置的空间量 D. 复制副本的更改率答案:C解析:CDP的日志卷存储所有写操作日志,日志空间越大,可保存的历史日志越多→恢复点范围越广;A/B/D与恢复点范围无关。
在CoFA 复制模式下,数据何时从源拷贝到目标?A. 首次从源上的位置发出读命令时 B. 首次向源上的位置发出读写命令时 C. 首次向目标上的位置发出读写命令时 D. 向源上的位置发出所有写命令时答案:B解析:CoFA(第一次访问时拷贝):首次对源/目标的位置读写时,先拷源旧数据到目标,再执行读写;A仅读不触发,C漏了源的写,D所有写触发(错误,仅首次)。
当虚拟机从其快照恢复时,来宾操作系统配置会发生什么情况?A. 来宾操作系统配置会恢复到快照创建PIT B. 会保留当前来宾操作系统配置 C. 来宾操作系统配置将复制到新的虚拟机中 D. 来宾操作系统设置会丢失且需要手动配置答案:A解析:虚拟机快照包含“系统配置+数据”,恢复时会将配置和数据一起恢复到快照创建时间点;B/C/D与快照恢复功能矛盾。
第十二章 远程复制
一、核心知识点
远程复制定义:在远程站点创建数据副本,应对区域灾难(如地震/洪水),实现异地灾备。
远程复制模式(高频考点)
模式
原理
RPO
带宽需求
距离限制
适用场景
同步复制
写源→写远程→确认主机
接近0
>最大写入负载
<200km(延迟低)
核心数据(如支付记录)
异步复制
写源→确认主机→缓冲后写远程
非零(如10min)
≥平均写入负载
无(如跨国家)
非核心数据(如日志)
远程复制技术
基于主机:LVM复制(同步/异步)、日志传送(数据库,传事务日志),占主机CPU。
基于阵列:阵列自带功能,支持同步/异步/磁盘缓冲(先本地复制,再传远程,省带宽),不占主机资源。
基于网络(CDP):加CDP应用装置,支持任意PIT恢复,适合核心业务。
三站点复制:提升灾备安全性,模式:
级联:源→站点A(同步)→站点B(异步/磁盘缓冲)。
三角形:源→站点A(同步)、源→站点B(异步),A与B互相同步。
数据迁移:异构阵列间移动数据,方式:
推送:控制阵列→远程阵列;拉入:远程阵列→控制阵列。
热迁移:迁移时主机可访问数据(热推/热拉,先复制再读写)。
虚拟化环境远程复制
虚拟卷镜像:虚拟卷复制到远程站点。
虚拟机迁移:虚拟机管理程序到管理程序(需共享存储)、阵列到阵列(移动VM文件)。
二、计算考点
无
三、课后选择题(含答案+解析)
哪个因素会影响同步远程复制解决方案中的写入响应时间?A. 源阵列上的LUN 数 B. 远程阵列上的LUN 数 C. 源和远程站点之间的距离 D. 远程阵列上配置的RAID 级别答案:C解析:同步复制需“写源+写远程”后确认,距离越远(如100km→5ms延迟,1000km→50ms延迟),响应时间越长;A/B/D与响应时间无直接关联。
下面哪一项准确描述了异步远程复制?A. 在发生灾难时提供接近零的RPO B. 不适合超出200 千米的距离 C. 向主机确认前,写入会提交到源和复制副本 D. 写入提交到源,并立即向主机确认答案:D解析:异步复制的核心是“先确认主机,再缓写远程”;A是同步复制特征,B适合长距,C是同步复制原理。
下面哪一项决定异步远程复制中的RPO?A. 应用装置响应时间 B. 平均读取工作负载 C. 缓冲区的大小 D. 远程阵列上的LUN 数答案:C解析:异步复制的RPO取决于“缓冲区大小”(缓冲越大,可存储更多待传数据,RPO越小)和带宽(带宽越大,传得越快,RPO越小);A/B/D与RPO无关。
在级联/多级跳(同步+ 磁盘缓冲)三站点复制中,至少需要多少个存储卷?A. 2 B. 3 C. 4 D. 5答案:B解析:级联模式需“源卷+站点A卷(同步副本)+站点B卷(磁盘缓冲副本)”,共3个卷;A是双站点复制,C/D多余。
有关虚拟机管理程序到虚拟机管理程序虚拟机迁移的描述,哪一项是正确的?A. 将虚拟机文件从源阵列移动到远程阵列 B. 支持在不同的存储阵列中移动虚拟机 C. 需要源和目标虚拟机管理程序访问同一存储 D. 在迁移过程中需要虚拟机脱机答案:C解析:虚拟机管理程序到管理程序迁移,需源和目标访问同一存储(如共享SAN),仅迁移VM内存状态;A是阵列到阵列迁移,B不支持不同存储,D支持在线迁移(不脱机)。
第十三章 云计算
一、核心知识点
云计算定义(NIST):按需访问可配置IT资源池(服务器/存储/网络),最小管理干预,特征:
按需自助服务:用户自动调配资源(如阿里云控制台开虚拟机)。
广泛网络访问:多客户端访问(PC/手机/平板)。
资源共用:多用户共享资源池(如1台物理机跑多租户VM)。
快速灵活:快速扩展/缩减资源(如双11临时扩容量)。
可计量的服务:按使用计费(如按CPU小时/GB存储收费)。
云服务模式(高频考点)
模式
定义
用户控制范围
示例
IaaS
提供基础设施(计算/存储/网络)
OS/APP/数据
阿里云EC2、AWS S3
PaaS
提供平台(OS/数据库/中间件)
APP/数据
Google App Engine、Azure
SaaS
提供应用程序(按需使用)
仅数据
钉钉、Salesforce CRM
云部署模式
公有云:服务商提供,多租户(如阿里云),成本低。
私有云:企业自建,单租户(如华为企业云),安全高。
社区云:多个企业共享(如医疗行业云),合规性好。
混合云:公有云+私有云(如核心数据放私有云,非核心放公有云),平衡成本与安全。
云基础架构:物理层(服务器/存储/网络)、虚拟层(资源池/虚拟资源)、应用层(APP/平台软件)、管理层(管理/访问软件)。
云挑战:用户角度(安全/合规、网络延迟、供应商锁定);提供商角度(服务保证、软件许可证、无标准接口)。
二、计算考点
无
三、课后选择题(含答案+解析)
哪项功能是由云计算提供的?A. 单向资源调配 B. 与服务提供商进行人工互动 C. 增加产品上市时间 D. 供应商锁定答案:A解析:云计算支持“单向资源调配”(用户自主扩/缩容);B需最小人工互动,C缩短上市时间,D是挑战(非功能)。
根据NIST,什么是云的本质特征?A. 开放API B. 基于策略的监控 C. 可计量的服务 D. 软件即服务答案:C解析:NIST定义的5大本质特征:按需自助、广泛网络访问、资源共用、快速灵活、可计量的服务;A/B是附加功能,D是服务模式。
基础架构即服务中提供哪些内容?A. 数据库管理系统 B. 操作系统 C. 应用程序 D. 存储答案:D解析:IaaS提供“基础设施”(计算/存储/网络);A是PaaS提供,B用户可自主安装(非IaaS提供),C是SaaS提供。
哪一项是云中的虚拟基础架构的组件?A. 管理软件 B. 存储阵列 C. 网络标识池 D. 服务目录答案:C解析:虚拟基础架构组件包括资源池(CPU/内存/存储)、标识池(VLAN ID/VSAN ID)、虚拟资源(VM/虚拟卷);A是管理层,B是物理层,D是用户界面。
针对云优化的存储的特征是什么?A. 以服务器为中心 B. 位置相关 C. 安全的多重租用 D. 单一访问机制答案:C解析:云优化存储特征:大规模可扩展、统一命名空间、基于策略管理、安全多租户(隔离多用户数据)、多访问机制;A是DAS特征,B是传统存储特征,D支持多访问机制(REST/SOAP/NFS)。
