【计算机三级备考】真题总结
真题tips
- 创建索引
CREATE INDEX <索引名> ON <表名> INCLUDE(属性名) WHERE 约束条件
- 用户定义的完整性可以用check和触发来实现,但是default只能约束参照完整性和实体完整性
- 在客户机和数据库服务器上使用数据库管理系统自带的客户端程序分别执行都很慢,则排除了网络对于数据处理的操作
- 文件备份和差异文件备份之后都必须在对日志进行备份
- 介质故障又称硬故障,是指物理设备的损坏导致数据库无法运行,系统故障是指造成系统停止运转的任何事件
- 分布式数据库:①数据传输通信代价大是因为各个站点分片见的连接和并操作;②分片透明性(最高层次透明性,只对全局关系进行操作而不必考虑关系分片的情况,位于全局概念模式与分片模式之间),位置透明性(不用考虑片段的存储场地),局部数据模型透明性;③目标:本地自治,非集中式管理,高可用性,位置独立性,数据分片独立性;④事务管理:恢复控制(基于两阶段提交协议),并发控制;⑤水平分片-行(元组)-重构关系,垂直关系-列(属性)-恢复关系;⑥半连接减少传输量;⑦通信代价最省;⑧水平分片,垂直,导出,混合;⑨分布式数据库系统由局部数据库管理系统,全局数据库管理系统,全局数据字典,通信管理
- 混合式数据分配是一种介于分割式和全复制式的分布方式
- 并行数据库:①顶层无共享结构,底层共享内存或共享磁盘结构;②无共享结构有很高的扩展性,适用于OLTP应用;③目的是通过高速通信介质连接多个可独立处理的单元一并行执行的方式完成对数据库系统的各种内部操作
- 并行数据库常用的划分技术有轮转法,散列划分,范围划分。
- 轮转法:对关系顺序扫描,元组在多个磁盘上均匀分布,整表扫描
- 范围划分:根据某个属性的取值区间划分成不同的子区间,然后根据子区间划分子表
- 散列划分:不同磁盘按属性划分
-
训练集用分类算法,聚类不用训练集
-
数据仓库不能实时更新,数据仓库是一个面向主题的,集成的,非易失的,随时间不断变化的
-
DDL(数据定义语句)经过DDL编译器编译后,各种对象的描述信息存放在数据库的数据字典中。
-
死锁检测:事务等待图
-
刀片服务器:无共享结构
-
细化程度越低,粒度越大
-
概念数据模型主要用来描述数据的概念化结构,与具体的数据库管理系统无关,所以没有描述数据的完整性约束条件
-
函数依赖—属性间的依赖
-
数据库应用系统实施活动—建立
-
Tinyint–0-255,smallint—30000-30000,int—9999999-9999999,bigint–几乎是无限到无限
-
用check约束,只涉及一列的时候就放在该列后面,涉及两列及两列以上就放在最后
-
提高多表连接的查询效率的方法是合并
-
数据库中的锁主要分为排它锁(可读写不可加锁)和共享锁(只能读不能写,能加共享锁不能加排它锁)
-
执行操作长时间无反应,cpu使用率低,io小,可能是数据被锁了,在客户端和服务器自带的客户端工具上都是长时间运行无响应则说明与网络无关
-
恢复语句:先全部备份,再差异备份(自上一次完全备份之后有变化的数据),最后日志备份,除了最后一个日志,其他的都要加norecovery,先database再log
-
对master数据库只能进行完整备份
-
OLAP(联机分析处理)数据量大,查询分析操作复杂,上层决策者使用;OLTP要求响应效率,安全性完整性要求高,中下层使用
-
标识列—IDENTITY
-
三级加锁协议完全保证并发事务数据的一致性;两阶段加锁协议:可串行性
-
对于故障发生前已经提交的事务(既有BEGIN Transaction又有commit)做redo操作;对于故障发生时未完成的事务(只有BEGIN Transaction,而没有commit或rollback)做undo操作
-
数据库的转储机制一般有完全转储(对整个数据库中的数据全部重新备份,效率低时间长),差量转储(效率高时间短)和增量转储(对数据库中凡是有记录变化的文件的整个文件进行复制,效率介于两者之间)
-
建表语句中没有为各表的主码添加约束,会影响语句的执行效率
-
分解不一定消除冗余数据,或增或减
-
关系数据模型只支持非过程化语言,select不检查完整性约束
-
RAID10比RAID5在写数据上更稳定速度更快
-
合成关系用实心菱形,动物—鸟(空心三角形),实现:大雁—飞翔(空心三角形加虚线),聚合:大雁—大雁群(空心菱形)
-
标量函数:AS可有可无,第二个return不加s
-
一个用户只能对应一个架构,一个架构可以对应多个用户
-
增加冗余列指的是在多个表中添加相同的列,虽然增加了数据库服务器存储的负担,但是减少了join操作
-
使用日志备份并不能降低数据库的空间使用量
-
日志文件没有损坏,首先进行结尾日志备份
-
元数据:描述数据的数据(日志不属于),分为技术元数据和业务元数据
-
在UML中,用例模型由用例,系统和角色三部分组成
-
datediff()计算两个日期之差
-
死锁回滚:事务内部故障
-
OLAP多维分析操作:卷起(维度上升);钻取(维度下降);切片/切块(局部数据);旋转(改变维的方向)
-
以多维数组作为存储结构的被称作MOLAP,基于关系型数据库的ROLAP,混合型的HOLAP
-
guest用户不继承,任何SQL Server登录账户都可以访问启用了的guest用户的数据库
-
建立RAID 5后可以使用的磁盘空间=(磁盘数量-1)*最小容量
-
数据库的恢复顺序:①最近的完全数据库备份;②最近的差异数据库备份;③日志备份
-
XML数据库需要对XML文档进行解析
-
支持度=两者同时出现次数/总次数;置信度=两者同时出现次数/前者出现次数
-
索引结构中的记录:索引列列值和其相对应的指针构成
-
SQL server2008支持三种用户自定义函数:标量函数,内嵌表值函数,多语句表值函数。标量函数可以出现在select语句目标列中,其他两个函数必须在from子句中
-
E-R图自下而上
-
order by可以对多个列进行排列,子查询只获取不排列
-
临时表可以加速查询,相关子查询不可以
-
水平分割:union,垂直分割:join
-
结构图:包图,复合结构图,类图,组件图,对象图,部署图
-
DDS分析型数据:静态,过去的数据,不可更新,综合,操作需求事先不知道,需要理解数据库,终端用户一般只读
-
事务日志保存更新操作
-
数据库监控系统分为手动监控机制和自动监控机制
-
数据仓库数据源不统一—转换
-
对象之间的联系以及对象间发送和接收消息的图—协作图
-
DFD是自顶向下的逐步细化的结构化分析方法
-
概念模型对实体集命名
-
硬件容错最完全的方法是设计两套相同的数据库系统同时工作,数据的变化也同步,空间也有一定的距离….
-
数据库在运行过程中系统突然停止转运,所有正在运行的事务以非正常的方式终止,则需要重新启动的故障时系统故障
-
事务日志能够实现数据恢复
-
多表约束用触发器(还可以时同一列取值区分),单表用check(同一个表列之间)
-
分区大小不够时可以创建一个备份集来备份
-
静态转储过程中系统不能运行其他事务,动态可以但是数据的有效性得不到保证
-
按照索引的实现方式:有序索引和散列索引
-
主键约束,外键,唯一性,缺省,检查
-
长时间的事务影响检查点的效果
-
聚类算法组内相似组外不相似
-
物化视图提高读取速度,其增加或删除不会影响应用程序中sql语句的正确性和有效性,可以手动刷新也可以自动刷新
-
ODS时数据仓库体系结构中的一个可选部分,1秒2时3天4来源
-
完整性(指正确性,一致性,相容性):创建触发器,定义事务隔离性级别
-
数据库管理员的职责有:-数据库的转储和恢复;-数据库安全性、完整性控制;-数据库性能的检测和改善;-数据库的重组和重构。
-
Google的云数据库是一个分布式的结构化数据存储系统,称为Big table。
-
知识发现:数据准备—数据挖掘—结果的解释评估
-
以记录为单位的日志文件和以数据块为单位的日志文件
-
数据库完整性包括实体完整性、参照完整性和用户自定义完整性。
-
实体完整性在CREATE TABLE中用PRIMARY KEY定义。参照完整性在CREATE TABLE中用FOREIGN KEY短语定义哪些列为外码,用REFERENCES短语指明这些外码参照哪些表的主码,用户自定义完整性在CREATE TABLE中定义属性的同时也可以根据应用要求,定义属性上的约束条件,即属性值限制,包括:列值非空(NOT NULL),列值唯一(UNIQUE),检查列值是否满足一个布尔表达式(CHECK短语)。
-
顺序图是用来描述对象自身及对象间信息传递顺序的视图。
-
活动图主要用于描述系统、用例和程序模块中逻辑流程的先后执行次序、并行次序。
-
分离数据库—分离数据文件,分离日志文件
-
多属性索引的顺序按照区分度排序
-
检查点应当由数据库恢复子系统自动的定期或者不定期的建立,而不应当由数据库管理员手动建立。故选择C选项。
-
主-备方式(Active-Standby方式)即指的是一台服务器处于某种业务的激活状态(即Active状态),另一台服务器处于该业务的备用状态(即Standby状态)。该方式的特点是当Active状态服务器出现故障的时候,通过软件诊断将Standby机器激活,保证系统在最短时间内恢复正常使用。
-
双主机方式(Active-Active方式)即指两种不同业务分别在两台服务器上互为主备状态(即Active-Standby和Standby-Active
状态),优点是两台服务器切换速度快,数据库连接不中断,应用不受影响。 -
SQL Server 2008 支持三种恢复模式,即简单恢复模式、完整恢复模式和大容量日志恢复模式。
简单恢复:无日志备份。自动回收日志空间以减少空间需求,实际上不再需要管理事务日志空间。最新备份之后的更改不受
保护。在发生灾难时,这些更改必须重做。只能恢复到备份的结尾。数据只读
完整恢复(容量大变化小):需要日志备份。数据文件丢失或损坏不会导致丢失工作。可以恢复到任意时点(例如应用程序或用户错误之前)。
大容量日志恢复:需要日志备份。是完整恢复模式的附加模式,允许执行高性能的大容量复制操作。通过使用最小方式记录
大多数大容量操作,减少日志空间使用量。如果在最新日志备份后发生日志损坏或执行大容量日志记录操作,则必须重做自该上次备份之后所做的更改。否则不丢失任何工作。可以恢复到任何备份的结尾。不支持时点恢复。
其中,如果符合下列任一要求,则使用完整恢复模式:您必须能够恢复所有数据;数据库包含多个文件组,并且您希望逐段
还原读/写辅助文件组(以及可选地还原只读文件组);您必须能够恢复到故障点;您希望可以还原单个页;您愿意承担事务日志备份的管理开销。 -
SQL Server支持对数据库中的一个数据文件进行还原的操作,在还原过程中数据库自动处于脱机状态,其他的文件都不能进
行读写操作,因此将受到一定的影响。还原过程中可以将数据库移动到其他地方 -
快照适合更新慢的
-
用例图描述系统与外部系统及用户之间的交互
-
开窗函数公式:函数名(列)OVER(选项)。OVER关键字表示把函数当成开窗函数而不是聚合函数。
SQL SERVER 2005/2008支持两种开窗函数,分别为:排名开窗函数和聚集开窗函数。聚合开窗函数只能使用
PARTITION BY子句不带任何语句,ORDER BY不能与聚合开窗函数一同使用。很多聚合函数都可以用作窗口函数的运算,
如SUM,AVG,MAX,MIN,COUNT。 -
next 下一条prior上一条first第一条 last absolute返回第几行 relative下面几行
-
数据库的重组并不修改原设计的逻辑和物理结构,而数据库的重构则要部分的修改数据库的模式和内模式。重构工作不仅会
修改数据库的模式(逻辑结构),也可能会修改数据库的内模式(物理结构) -
事务故障包括预期内的事务故障和非预期的事务故障,两种事务故障的恢复都是由系统自动完成的,对用户是透明的。
-
无共享结构每个处理机拥有独立的主存储器和磁盘,不共享任何资源。它被认为是支持并行数据库系统的最好并行结构,比较适用于银行,出纳,民航售票等OLTP类应用。
-
数据库的反规范化为了减少表间的链接
-
实例的作业信息存储在msdb数据库中,作业的执行不需要任何人工干预
-
在数据库性能优化时,**并不是范式级别越高越好。**虽然规范化程度高数据冗余度低,但过高的范式级别可能会导致查询时需
要进行更多的连接操作,反而降低查询性能。所以为了性能优化,有时会适当降低范式级别,增加一定的数据冗余来减少连
接操作,提高查询效率,增加冗余列减少连接操作,增加派生性冗余列和汇总表会占用更多存储空间 -
检查点记录的内容包括:建立检查点时刻所有正在执行的事务清单;这些事务最近一个日志记录的地址。恢复子系统可以定期或不定期地建立检查点来保存数据库状态。系统在恢复时,如果事务在故障发生时未完成,应当UNDO;如果事务在检查点之后才提交,它们对数据库所做的修改在故障发生时还可能在缓冲区中,尚未写入数据库,所以要REDO;如果事务在检查点之前已经提交,所以以不必执行REDO操作。
-
水平分割后得到的表结构相同,存储的数据不同
-
ETL是实现数据集成的主要技术,即填充更新数据仓库的数据抽取,转换和装载的数据采集过程
-
UNIQUE、FOREIGN KEY和PRIMARY KEY应用于关系级别约束,NOT NULL应用于列级约束,CHECK应用于元组约束。
-
散列文件要精确查询
-
RAID5与RAID1读速度差不多但是写1大于5
-
完全转储是对数据库中所有数据进行转储,此种方式占用较多的时间和空间。**差量转储是对最近一次数据库完全转储以来发生的数据库变化进行转储。增量转储只复制上次转储后发生变化的文件或数据块。**增量转储所需的时间和空间都比较短,但增量转储数据只能和完全转储配合,才能对数据库进行恢复。**增量转储的恢复时间比完全转储要长。**差量转储和完全转储相比速度快,占用空间小;差量转储和增量转储比速度慢、占用空间多,但是恢复速度快。
-
数据库备份不影响正常使用
-
决策支持系统辅助决策