数据仓库和商务智能考试考点及关系梳理
一、核心考点分类及具体内容
(一)基础定义与核心区别(高频基础考点)
- 核心定义
概念 | 核心含义 | 关键目标 |
数据仓库(Data Warehouse, DW) | 面向主题、集成、稳定、时变的结构化数据存储系统,通过整合多个数据源(OLTP系统、文件、API等)的历史数据,为企业决策提供统一的数据基础 | 1. 数据整合:消除数据孤岛,形成企业级统一数据视图; |
商务智能(Business Intelligence, BI) | 基于数据仓库等数据源,通过数据抽取、分析、可视化等技术,将数据转化为业务洞察和决策支持的应用体系 | 1. 数据分析:通过OLAP、统计分析等挖掘数据价值; |
- 核心区别与联系
-
- 区别:
-
-
- 数据仓库是**“数据存储层”**,侧重数据的整合、存储和管理(“存好数据”);
- 商务智能是**“数据分析与展示层”**,侧重数据的分析、可视化和决策支持(“用好数据”)。
-
-
- 联系:数据仓库是商务智能的核心数据源,商务智能是数据仓库价值的最终体现;两者共同构成“数据整合→分析→决策”的闭环。
- 与OLTP系统的关键差异
对比维度 | 数据仓库(OLAP) | 传统数据库(OLTP) |
核心用途 | 决策支持、多维分析(如“各区域季度销售额对比”) | 业务交易处理(如“客户下单、库存更新”) |
数据特征 | 面向主题、集成、稳定(非实时更新)、历史数据 | 面向业务流程、分散、动态(实时更新)、当前数据 |
操作类型 | 复杂查询(多表关联、聚合计算)、低并发 | 简单CRUD(增删改查)、高并发 |
数据量 | 海量(TB/PB级) | 中少量(GB级) |
- 考试高频题型:单选题(区分数据仓库与BI/OLTP的差异)、多选题(选择数据仓库/BI的核心目标)、判断题(数据仓库是否支持实时交易)。
(二)数据仓库核心特征与架构(考试重点)
- 四大核心特征(DAMA-DMBOK标准)
-
- 面向主题:围绕企业核心业务主题(如“客户”“产品”“销售”)组织数据,而非按业务流程(如“下单”“支付”),例如“销售主题”整合订单、库存、客户数据,支撑销售分析。
- 集成性:将分散在多个数据源(ERP、CRM、Excel文件等)的异构数据(结构化、半结构化)通过清洗、转换、整合,消除冗余和冲突(如统一客户ID格式)。
- 稳定性(非易失性):数据一旦加载到数据仓库,通常不修改或删除,仅追加新数据(如每日新增前一天的交易数据),确保历史数据可追溯。
- 时变性:保留时间维度数据(如每个月的销售数据),支持趋势分析(如“近3年Q4销售额对比”),数据按时间周期(天/周/月)更新。
- 经典架构模型(Inmon vs Kimball)
架构类型 | 核心思想 | 架构分层 | 优势 | 劣势 | 适用场景 |
Inmon(企业级架构) | 先构建企业级数据仓库(EDW),再基于EDW构建数据集市(DM),强调“自上而下”整合 |