计算机四级 - 数据库原理 - 第9章「数据库应用及安全性」
9.1 数据仓库
1. 数据仓库: 面向主题的、集成的、相对稳定的、反应历史变化的数据集合。数据进入数据仓库之前应进行清洗和重新格式化,或者说经过ETL(抽取、转换、装载)
2. 数据仓库和OLAP操作都是基于多维数据模型的,维是人们观察数据的特定角度,多维数据模型涉及两类表:维表和事实表。两个常见的多维模式是星型模式和雪花模式,星形模式由一个事实表和每个维对应的维表组成;雪花模式将星型模式的维表通过规范化组织成层次结构,因此,雪花模式与星型模式的数据冗余要低。
3. 对于遵循维格式的数据,在多维矩阵上的查询性能比关系数据模型上的查询性能好得多
4. 数据仓库的存储利用了索引技术来支持更高性能的访问,数据仓库应用是一个典型的客户/服务器结构形式。OLAP服务器的实现可以是关系型ROLAP,也可以是多维MOLAP
5. OLAP的基本功能:
①切片和切块
②钻取
向下钻取:是使用户在多层数据中展现渐增的细节层次,获得更多的细节性数据
向上钻取:以渐增概括方式汇总数据
③旋转
9.2 数据挖掘
1. 影响数据挖掘质量的要素有两个,一是所采用的数据挖掘技术的有效性,二是用与挖掘数据的质量和数量
2. 数据挖掘的目标分为:预测、识别、分类和优化
3. 关联规则:同时满足最小支持阈值和最小可信度的阈值的规则
关联规则的挖掘一般分为两个过程:
找出所有的频繁项集
由频繁项目产生关联规则;常用的关联规则算法有Apriori算法、采样算法等
4. 分类是学习一种模型的过程,该模型描述了数据的不同类别,这些类别是预先确定的。分类活动也称为有监督的学习,有监督的学习指的是模型的学习在被告知每个训练样本属于哪个类的"指导”下进行的,新数据使用训练数据集中得到的规则进行分类;
学习模型的第一步,是通过使用已经分类的训练数据集合来实现的;
可用于进行分类的算法有很多,比如决策树方法、BAYES方法、神经网络方法、支持向量机方法等。
5. 聚类的目标是把记录分组,这样在同一个组中的记录彼此都是相似的,并且同其他组中的记录是不相似的;它是一种无监督学习算法,比较经典的是k-means算法,BIRCH是一个混合算法
9.3 数据的安全性
1. 数据库安全性机制分为自主安全性机制(用于向用户授予特权)和强制安全性机制(用于对多级安全性进行控制)。为了保证数据库的安全性,控制措施有访问控制、推理控制、流控制和加密
2. 数据库管理员(DBA)的职责有:账户创建、权限授予、权限收回和安全性级别指定,同时也负责保证数据库系统的总体安全
3. 使用数据库系统可以在两个级别上分配权限:账户级和关系级,用户级包括create table、modify这种权限。关系的属主拥有这个关系上的所有权限
4. all - or - nothing是在关系上授予和回收权限的自主访问控制技术。典型的安全性级别有:绝密、机密、秘密和无分类
5. 公钥加密有6个组成部分:明文、密文、加密算法、解密算法、私钥、公钥。签名的验证者不需要知道任何的秘密数
6. 双钥加密体制中的加密秘钥和解密秘钥是不相同的,该算法使用一个秘钥(公开的)进行加密,用另外一个秘钥进行(不公开的)解密
7. 安全等级:
- A类安全等级:级别最高,为验证保护级
- B类安全等级:强制保护级
- C类安全等级:自主保护级,可划分为C1和C2,用户认为C1系统中所有文档具有相同的机密性
- D类安全等级:无保护
其余章节进我主页进行查看