数据库系统-数据库模式
三级模式与两级映射
外模式:用户视图
外模式-概念模式映射:保证数据的逻辑独立性
概念模式:简称为模式,整个数据库的逻辑结构,数据库的核心,基本表
概念模式-内模式映射:保证数据的物理独立性
内模式:也叫存储模式、物理模式,物理级数据库,具体的存储文件
表(关系表)类型
基本关系(通常又称为基本表或基表):实际存在的表,实际存储数据的逻辑关系
查询表:查询结果对应的表
视图表:由基表或其它视图表导出的表,本身不独立存储,数据库只存放它的定义,常称为虚表
分布式数据库
集中式数据库会将所有数据存储在一台设备上,分布式数据库会将数据在物理上分开存储
优点:
- 数据独立性:除了数据在逻辑和物理上的独立,还有数据的分布独立性(分布透明性)
- 集中于自治共享结合的控制结构:各局部的DBMS可以独立地管理局部数据库,具有自治的功能。同时,系统又设有集中控制机制,协调局部DBMS的工作,执行全局应用
- 适当增加数据冗余度:在不同的场地存储同一数据的多个副本,提高系统的可靠性和可用性,同时也提高系统的性能
- 全局一致性、可串行性和可恢复性
分布透明性
- 分片透明性:水平分片(根据每一行存储的内容的其它属性不同,拆开存储),垂直分片(根据每一列存储的内容分开存储),混合分片(同时运用水平分片和垂直分片);透明性是指用户不必关心数据是如何分片的,它们对数据的操作在全局关系上进行,如何分片对用户是透明的
- 位置透明性:是指用户不必知道所操作的数据放在何处,数据分配到哪个或哪些站点存储对用户是透明的
- 局部数据模型透明性:最低层次的透明性,用户不必关心局部DBMS支持哪种数据模型、使用哪种数据库操作语言。
两阶段提交协议2PC
2PC事务提交的两个阶段:
- 表决阶段,目的是形成一个共同的决定
- 执行阶段,目的是实现这个协调者的决定
两条全局提交规则:
- 只要有一个参与者撤销事务,协调者就必须做出全局撤销决定
- 只有所有参与者都同意提交事务,协调者才能做出全局提交决定
关系代数
并∪(二元运算、同构):将两张二维表的记录合并
交∩(二元运算、同构):取两张二维表的重复部分
差 -(二元运算、同构):被减的二维表去掉与减数重复的部分
笛卡尔积 ×(二元运算):列:二者之和(可用列号标识);行:二者乘积;两张表的全组合。
投影(一元运算)Π:取相应的属性列,竖直方向上的选择
选择(一元运算)σ:取符合条件的整条记录,水平方向上的选择
自然连接 :列:二者之和去重复;行:所有同名属性的值相等的记录
查询效率:先压缩数据再筛选结果,自然连接的效率比笛卡尔积高