《数据库系统概论》第一章 初识数据库
一、数据库系统基础概念
1. 数据库的 4 个核心概念
数据是数据库中存储的基本对象,指描述事物的符号记录,像数字、文字、图形、音频等都属于数据。
数据库是长期储存在计算机内、有组织且可共享的大量数据集合。
数据库管理系统是位于用户与操作系统之间的一层数据管理软件,属于基础且复杂的软件系统。
其核心功能理解:
- 数据定义:提供数据定义语言(DDL),定义数据库中的数据对象;
- 数据操纵:提供数据操纵语言(DML),实现查询、插入、删除、修改等操作;
数据库系统由数据库、数据库管理系统(及应用开发工具)、应用程序和数据库管理员组成,是完整的数据管理解决方案,也是信息系统的核心。
2. 数据管理技术的三个发展阶段
人工管理阶段:
特点:数据不保存
文件系统阶段:
特点:数据可长期保存,记录内有结构但整体无结构
数据库系统阶段:
特点:数据整体结构化
3. 数据库系统的特点
数据结构化
数据共享性高、冗余度低且易扩充
数据独立性高
数据由数据库管理系统统一管控
二、数据模型
1. 数据模型的分类(按应用目的)
概念模型(信息模型):按用户观点建模,用于数据库设计,是现实世界到机器世界的中间层;需真实模拟现实、易理解,是设计人员与用户的交流工具,常用 E-R 图描述。
逻辑模型:按计算机系统观点建模,用于数据库管理系统实现;包括层次模型、网状模型、关系模型、面向对象模型等。
物理模型:对数据底层存储的抽象,描述数据在系统内的表示和存取方式(如磁盘存储结构、索引方式);由数据库管理系统自动处理,用户无需关注。
数据抽象过程:先将现实世界抽象为概念模型(现实→信息世界,设计人员完成),再将概念模型转换为逻辑模型,最后由数据库管理系统将逻辑模型转换为物理模型(信息→机器世界)。
2. 概念模型的核心要素
信息世界的基本概念:
- 实体:客观存在且可区分的事物(如 “学生”“课程”);
- 属性:实体的特性(如学生的 “学号”“姓名”);
- 码:唯一标识实体的属性集(如学生的 “学号”);
- 实体型:用 “实体名 + 属性名集合” 描述同类实体(如 “学生(学号,姓名,性别)”);
- 实体集:同一类型实体的集合(如 “全体学生”);
- 联系:实体间的关联,分一对一(1:1)、一对多(1:n)、多对多(m:n)(如 “学生 - 选修 - 课程” 是 m:n 联系)。
E-R 图表示方法:
- 实体型:用矩形表示,标注实体名;
- 属性:用椭圆形表示,标注属性名,通过线段连接对应实体;
- 联系:用菱形表示,标注联系名,通过线段连接关联实体,线段旁标注联系类型(1:1、1:n、m:n)。
3. 数据模型的三要素
数据结构
数据操作
数据的完整性约束条件
4. 常用逻辑数据模型
层次模型:
- 优点:结构清晰,查询效率高,完整性支持好;
- 缺点:无法直接表示多对多联系,命令趋于程序化。
网状模型:
- 优点:直接描述现实世界,存取效率高,可以表示多对多关系;
- 缺点:结构复杂、不易掌握,DML 语言复杂。
关系模型:
- 优点:基于严格数学概念,概念单一(实体 / 联系均为表),存取路径透明,数据独立性高;
- 缺点:查询效率可能低于格式化模型,增加数据库管理系统开发难度。
三、数据库系统的结构
1. 三级模式结构(应用开发人员视角)
外模式(子模式 / 用户模式):描述用户使用的局部数据逻辑结构,是用户的数据视图;一个模式可对应多个外模式,外模式是模式的子集。
模式(逻辑模式):描述数据库全体数据的逻辑结构与特征,是公共数据视图;一个数据库仅一个模式,独立于硬件和应用,是系统结构的中间层,连接外模式与内模式。
内模式(存储模式):描述数据物理结构与存储方式(如存储路径、索引结构);一个数据库仅一个内模式,独立于外模式和应用,定义数据在磁盘的存储细节。
2. 二级映像与数据独立性
映像就像指示牌,起到指引作用
外模式 / 模式映像:定义外模式与模式的对应关系,每个外模式对应一个映像;模式修改时,修改该映像可保持外模式不变,进而保证应用程序不变,实现逻辑独立性。
模式 / 内模式映像:定义模式与内模式的对应关系,一个数据库仅一个该映像;内模式修改时,修改该映像可保持模式不变,进而保证应用程序不变,实现物理独立性。