数据管理与数据库1.1-1.2
1.1 数据库的常用术语
1.2 计算机数据管理技术的产生和发展
1.3 数据模型
1.4 数据库系统的模式结构
1.1.1 数据库系统概述
数据(Data):描述客观事物特征或性质的某 种符号。描述事物的符号可以是数值,也可 以是文字、图形、图像、声音、语言等多种 形式,它们都可以经过数字化处理后存入计 算机。
–例如,一组数据 5201314 语义1:电话号码 语义2:存款 语义3:表白暗语 语义4:请同学给出。。。–数据的语义:数据含义的说明,非常重要
数据项(Item of Data):数据的基本单元,即最 小单位,它是某类客观事物的某个特征或性质的 数据抽象。每个数据项:名字(数据项名)+若干 可能的取值(数据项值)。
例如:学生
数据项名:(“姓名”、“性别”、“籍贯”)
数据项值:(“李明”、“男”、“江苏”)
数据库(DataBase,简称DB):长期存储在计 算机内的、有组织的、可共享的数据集合。
实体:客观存在的事物
联系:实体跟实体之间的联系
数据库管理系统:DataBase Management System,简称DBMS,是位于用户与操作 系统(OS)之间的,使人们能对数据库中的 数据进行科学地组织、高效地存取和维护 管理的一种数据管理软件。
功能:为用户提供数据定义、数据操纵、 数据库控制、数据库的建立和维护等功能。
DBMS的主要功能包括:
(1) 数据库定义功能
DBMS通过提供数据定义语言(Data Definition Language - DDL)来对外模式、模 式和内模式加以描述和定义,即定义数据库的 逻辑结构、存储结构、语义信息和保密要求等。
(2) 数据操纵功能
DBMS提供数据操纵语言(Data Manipulation Language—DML)实现对数据库中数据的基本 操作,如检索、插入、修改、删除和排序等等。
(3) 数据库控制功能
控制整个数据 库系统的运行,包括安全性保护、 并发控制、存取控制等。
(4) 数据库维护功能。
数据库维护功能:包括初始数 据的装入、数据库的转储或后 备功能、数据库恢复功能、数 据库的重组织功能以及性能分 析等功能
1.1.2 数据库系统的组成
数据库系统:DataBase System,简称DBS, 是计算机系统、DB、DBMS、应用软件、 数据库管理员(DataBase Administrator,简 称DBA)和用户的总和。
DBS一般由硬件、软件(包括开发工具)、数 据库、数据库管理员和用户构成。
数据库系统简称为数据库
、硬件平台及数据库
数据库系统对硬件资源的要求
(1) 足够大的内存–操作系统–DBMS的核心模块–数据缓冲区–应用程序
(2) 足够大的外存– 磁盘或磁盘阵列 ➢数据库– 光盘、磁带 ➢数据备份
(3) 较高的通道能力,提高数据传送率
二、软件
支持DBMS运行的操作系统
与数据库接口的高级语言及其编译系统
以DBMS为核心的应用开发工具
为特定应用环境开发的数据库应用系统
三、人 员
数据库管理员 系统分析员和数据库设计人员 应用程序员 用户
不同的人员涉及不同的数据抽象级别,具有不同的数据视图,如 下图所示
1. 数据库管理员(DBA) 具体职责:
1.决定数据库中的信息内容和结构
2.决定数据库的存储结构和存取策略
3.定义数据的安全性要求和完整性约束 条件
4.监控数据库的使用和运行–周期性转储数据库 •数据文件 •日志文件–系统故障恢复–介质故障恢复–监视审计文件
5. 数据库的改进和重组–性能监控和调优–定期对数据库进行重组织,以提高系统的 性能–需求增加和改变时,数据库须需要重构造
系统分析员–负责应用系统的需求分析和规范说明–与用户及DBA协商,确定系统的硬软件配置–参与数据库系统的概要设
数据库设计人员–参加用户需求调查和系统分析–确定数据库中的数据–设计数据库各级模式
3. 应用程序员 设计和编写应用系统的程序模块 进行调试和安装
4. 用户 用户是指最终用户(End User)。最终用户通过应用系 统的用户接口使用数据库。
1. 偶然用户–不经常访问数据库,但每次访问数据库时往往需要不同的 数据库信息–企业或组织机构的高中级管理人员
2. 简单用户 –主要工作是查询和更新数据库–银行的职员、机票预定人员、旅馆总台服务员
3. 复杂用户–工程师、科学家、经济学家、科技工作者等–直接使用数据库语言访问数据库,甚至能够基于数据 库管理系统的API编制自己的应用程序
1.2 计算机数据管理技术的 产生和发展
1.2.1 人工管理阶段
人工管理阶段(20世纪50年代中期以前)是计 算机数据管理技术经历的第一个阶段。 计算机数据管理:指利用计算机对数据进行分 类、组织、存储、维护、检索和传输的一系列 操作,它是数据处理的前提和中心问题。
产生的背景–应用需求科学计算–硬件水平无直接存取存储设备–软件水平没有操作系统–处理方式批处理
特点–数据的管理者:用户(程序员),数据不保存–数据面向的对象:某一应用程序–数据的共享程度:无共享、冗余度极大–数据的独立性:不独立,完全依赖于程序–数据的结构化:无结构–数据控制能力:应用程序自己控制
1.2.2 文件系统阶段
文件系统阶段(从20世纪50年代后期到20世纪60年 代中期)是计算机数据管理技术经历的第二个阶段。
产生的背景–应用需求科学计算、管理–硬件水平磁盘、磁鼓–软件水平有文件系统–处理方式联机实时处理、批处理
特点–数据的管理者:文件系统,数据可长期保存–数据面向的对象:某一应用程序–数据的共享程度:共享性差、冗余度大–数据的结构化:记录内有结构,整体无结构–数据的独立性:独立性差,数据的逻辑结构改变必–须修改应用程序–数据控制能力:应用程序自己控制
文件系统比人工管理阶段有了很大的改进,但仍存数 据冗余度大,数据独立性较差等缺点。
文件系统中数据的结构特点–记录内有结构。–数据的结构是靠程序定义和解释的。–数据只能是定长的。 • 可以间接实现数据变长要求,但访问相应数据的应用程序 复杂了。–文件间是独立的,因此数据整体无结构。 • 可以间接实现数据整体的有结构,但必须在应用程序中对 描述数据间的联系。–数据的最小存取单位是记录。
1.2.3 数据库系统阶段
数据库系统阶段(从20世纪60年代后期至今)是 计算机数据管理技术经历的第三个阶段。
产生的背景–应用背景 大规模管理–硬件背景 大容量磁盘、磁盘阵列–软件背景 有数据库管理系统DBMS–处理方式 联机实时处理,分布处理,批处理
特点: (1)整体数据的结构化:不仅用数据模型描述 数据本身的特征,还描述了数据之间的联系, 且这种联系通过存取路径(指针)来实现整体数 据的结构化。 (2)数据独立性较高:高度的物理独立性和一 定的逻辑独立性 (3)数据的共享性好,冗余度低,易扩充:因 为数据不再面向某个应用而是面向整个系统。(4)提供了数据的完整性控制功能 安全性(Security)保护:防止非法用户使用数 据库造成数据的泄密和破坏。 数据的完整性(Integrity):预防合法用户无意 中造成数据的错误和数据之间的不一致性。 并发控制(Concurrent Control): 保证多个用户 并发存取、修改数据库时,数据的正确性和 完整性。 数据库恢复(Recovery):当计算机硬件、软件、 操作失误等影响数据库数据正确性时,把数 据库恢复到以前某个正确和一致状态 。
1.2.4 数据库技术的发展
第一代数据库技术,即层次数据库和网状 数据库技术;
第二代数据库技术,即关系数据库技术; 第三代数据库技术,即新一代数据库技术, 以面向对象模型为主要特征的数据库技术。
层次数据库和网状数据库技术。这一代的数据库 管理系统主要支持层次和网状数据模型。
主要特点: ★支持三级模式结构; ★用存取路径(指针)来表示数据之间的联系; ★数据定义语言(Data Definition Language,简称 DDL)和数据操纵语言(Data Manipulation Language, 简称DML)相对独立; ★数据库语言采用过程性(导航式)语言。
关系数据库技术 -》关系数据模型
(严格的数学理论基础,概念简单、清晰,易于用 户理解和使用) 主要特点: ★概念单一化,数据及其数据间的联系都用关系 来 表示; ★以关系代数为理论基础,数据独立性强; ★ 数据库语言采用说明性语言,大大简化了用 户的编程难度
新三代数据库技术 (第13章)数据库技术新发展 (面向对象模型,尚未完全成熟)
主要特点: ★支持包括数据、对象和知识的管理; ★在保持和继承第二代数据库技术基础上引入新 技术,如面向对象技术等, ★对其它系统开放,有良好的可移植性、可扩充 性和可互操作性。