02117 信息组织【第七章】
数据库技术
原始内容
- 数据库技术发展:
○ 第一代数据库(层次式数据库与网状数据库)
○ 第二代数据库(关系数据库)
○ 第三代数据库(面向对象数据库) - 数据库系统的结构:
单用户数据库系统、主从式数据库系统、分布式数据库系统和C/S (Client/Server) 数据库系统。 - 关键缩写(P193,选择题高频):
计算机辅助设计/制造 (CAD/CAM);计算机辅助软件工程 (CASE);计算机集成制造 (CIM)。 - 数据库系统的信息组织方法:
INSPEC 分为四辑:
○ A(铜):物理专辑
○ B:电气电工
○ C(铅):计算机与控制
○ D(锡):信息技术 - Web数据库信息与半结构化数据库系统:
半结构化数据:Web上的数据则介于完全结构化和完全无结构之间。 - 多媒体数据库的信息组织方法:
关键技术有(7点):
(1) 数据模型。建立数据库模型是实现多媒体数据库的关键。
(2) 数据的压缩和还原技术
(3) 存取管理和存取方法
(4) 用户界面
(5) 分布式技术
(6) 多媒体信息的检索与查询
(7) 多媒体数据的输入 - 分布式超媒体数据库:
分布式超媒体数据库系统HDB (Hypermedia Data Base) 是一种以超媒体信息管理技术为基础的分布式系统。
HDB有三层结构:最底层;中间层;最上层。
记忆重点
8. 数据库发展三代(记“代次+类型”,必背):
○ 第一代:层次式+网状;
○ 第二代:关系;
○ 第三代:面向对象;
9. 系统结构(4种,记名称):单用户、主从式、分布式、C/S;
10. 关键缩写(P193,记“缩写+中文”):
○ CAD/CAM=计算机辅助设计/制造;
○ CASE=计算机辅助软件工程;
○ CIM=计算机集成制造;
11. INSPEC四辑(记“字母+金属+内容”,易混点):
字母 对应金属 内容
A 铜 物理专辑
B - 电气电工
C 铅 计算机与控制
D 锡 信息技术
12. 半结构化数据定义:Web数据介于完全结构化与无结构之间;
13. 多媒体数据库关键技术(7点,记关键词):数据模型、压缩还原、存取管理、用户界面、分布式、检索查询、数据输入;
14. HDB:分布式超媒体数据库,记“三层结构”(仅记层次数量,不扩展细节)。
一、数字图书馆概念与特征
原始内容
- 数字图书馆的起源与发展
图书馆的自动化阶段;电子图书馆阶段;数字图书馆阶段 - 数字图书馆的基本要素:
数字化的馆藏;先进的信息存储与检索系统;便捷的电子服务 - 数字图书馆的特征(P208,简答题/选择题★★★):
数字图书馆是一种有别于传统图书馆的新型图书馆,与传统图书馆相比,数字图书馆新型组织发生了重大变化,呈现以下特征:
(1) 数字图书馆信息组织对象类型已大大扩展,除了文字信息外,声音、图像、视频等类型的信息只要能够数字化的也都可以是数字图书馆的收藏和组织对象。
(2) 数字图书馆的信息组织是一种分布式模式。其信息对象可能并不存储在同一个地方,而可能分布在不同的数据服务器上。
(3) 数字图书馆的信息对象是一种以机读型信息形式存储与检索的数字化信息对象。
(4) 数字图书馆信息对象的格式化特征和多格式化特征。数字信息按照特定格式存储,各种类型的信息可以用不同的信息格式来描述,同一内容的信息也可用多种格式来描述。数字图书馆是依托因特网而存在的图书馆,是没有时空限制、便于使用、超大规模的知识中心。 - 数字图书馆是国家信息基础设施的重要组成部分,已成为衡量和评价一个国家信息基础水平的重要标志。
中国试验型数字式图书馆项目有:中国古籍善本文影像数据库、中国博士论文影像数据库、历史图片数据库、孙中山文献全文数据库、深圳特区文献数据库、国内外旅游多媒体数据库、民国时期文献数据库、东北文献目录数据库和国际数字图书馆文献数据库等。 - 数字图书馆的体系结构(P215,简答题★★★,可画图也可文字说明):
数字图书馆的系统设计一般有三层结构:外层、内层和虚拟网站层
○ 外层为外部用户层,可以是因特网的任何用户,通过Internet与Web服务器或应用服务器连接,共享数字图书馆的信息资源
○ 内层为Intranet层,主要为满足内部用户需要,为内部用户提供服务。可根据用户需求,不断调整服务项目,满足新的信息需求
○ 虚拟网站层是信息资源的提供层,它有大量的信息资源数据库作支撑。 - 数字图书馆信息组织原则(简答题/选择题★★★):
选择性原则;多维揭示原则;非线性组织原则;标准化原则;完备性原则
记忆重点
- 起源与发展(3个阶段,直接记关键词,无延伸)
● 核心顺序:自动化阶段 → 电子图书馆阶段 → 数字图书馆阶段(按技术升级逻辑记忆,不混淆) - 基本要素(3个,记“资源+系统+服务”逻辑)
● 资源:数字化的馆藏;
● 系统:先进的信息存储与检索系统;
● 服务:便捷的电子服务(三者缺一不可,简答题直接罗列) - 特征(4点,记“对象+模式+存储+属性”框架,避免记长句)
特征维度 核心关键词 关键说明
对象类型 大大扩展 文字+声音+图像+视频(可数字化)
组织模式 分布式 信息存于不同数据服务器
存储检索形式 机读型数字化 区别于传统纸质,依赖计算机
格式与属性 格式化+多格式化,无时空限制 同一内容可多格式,依托因特网,超大规模 - 中国试验型项目(记“典型数据库类型”,无需全背,抓高频)
● 核心代表:古籍善本、博士论文、孙中山文献、民国时期文献(记“古籍、学位、名人、特定时期”四类,覆盖主要方向) - 体系结构(三层结构,简答题必背“层级+用户/功能+支撑”)
层级 名称 核心功能/服务对象 关键支撑
外层 外部用户层 服务因特网所有用户,共享资源 Internet+Web/应用服务器
内层 Intranet层 服务内部用户,灵活调整服务项目 按需适配内部需求
虚拟网站层 信息资源提供层 提供信息资源 大量信息资源数据库
● 提示:简答题可画“三层堆叠图”(外层→内层→虚拟网站层),或文字分点说明,清晰即可。 - 信息组织原则(5个,记关键词,避免遗漏)
● 核心原则:选择性、多维揭示、非线性组织、标准化、完备性(按“选资源→多维度揭示→非线组织→守标准→保全面”逻辑记忆,简答题直接罗列)