2018年10月江苏省自考《信息组织》试题
一、单项选择题:本大题共15小题,每小题1分,共15分。在每小题列出的各选项中只有一项是最符合题目要求的,请将其选出。
- “电子计算机”、“电脑”之间的关系类型是
A. 并列关系
B. 包含关系
C. 同一关系
D. 交叉关系
答案:C. 同一关系
解析:“电子计算机”与“电脑”是同一事物的不同称谓,属于同义词关系,即同一关系。文献中明确指出“电子计算机(Electronic Computer),又称电脑”。
- 下列信息资源描述项目中 不属于《都柏林核心集》 的是
A. 主题
B. 关系
C. 版本
D. 权限管理
答案:C. 版本
解析:《都柏林核心集》(Dublin Core)包含15个核心元数据元素,其中包括“主题(Subject)”“关系(Relation)”“权限管理(Rights)”,但没有“版本(Version)”这一独立元素。版本信息通常通过“描述(Description)”或“标识符(Identifier)”等字段间接表达。
- 《伏势:“改变我们生活的十个新方向”》中“改变我们生活的十个新方向”是
A. 正题名
B. 副题名
C. 并列题名
D. 合订题名
答案:B. 副题名
解析:副题名是对正题名的解释、说明或补充,通常置于正题名之后,用冒号、破折号等分隔。此处“伏势”为主名称,“改变我们生活的十个新方向”起解释作用,符合副题名定义。
- 分类法中“生物科学”和“植物学”两个类目之间的关系是
A. 从属关系
B. 相关关系
C. 并列关系
D. 交替关系
答案:A. 从属关系
解析:在知识体系中,“植物学”是“生物科学”下的一个分支学科,二者构成上位类与下位类的从属(隶属)关系。
- DDC 的全称是
A. 《杜威十进分类法》
B. 《美国国会图书馆分类法》
C. 《国际十进分类法》
D. 《中国图书馆分类法》
答案:A. 《杜威十进分类法》
解析:DDC 是 Dewey Decimal Classification 的缩写,中文全称为《杜威十进分类法》,由美国图书馆学家麦尔威·杜威于1876年创立。
- 《中图法》中,“军事”的大类类号是“E”,“名词、词典、百科全书”在总论复分表的代号是“61”,则“军事大百科”的类号是
A. E - 61
B. E : 61
C. E (61)
D. E = 61
答案:A. E - 61
解析:根据《中图法》规定,使用通用复分表时,应将复分号(连同短横“-”)加在主类号之后,因此“军事大百科”的类号为 E-61。
- 叙词表系统中将词表中的叙词按照词素的字顺排列,使含有同一词素的叙词集中显示于一处的词汇表是
A. 字顺表
B. 轮排索引
C. 词族索引
D. 范畴索引
答案:B. 轮排索引
解析:轮排索引(KWIC)通过轮换词组中各词的位置,使含有相同词素的叙词集中排列,便于族性检索。
- 关于《都柏林核心集》,描述 错误 的是
A. 《都柏林核心集》将描述项目分为15个大项
B. 《都柏林核心集》具有灵活性
C. 《都柏林核心集》是根据传统文献描述与识别需要设置的
D. 《都柏林核心集》的描述项目具有可扩展性
答案:C. 《都柏林核心集》是根据传统文献描述与识别需要设置的
解析:都柏林核心集最初是为网络资源(数字对象)设计的元数据标准,强调通用性与跨平台适用性,并非专为传统文献设置。
- 双主题文献《计算机在农业生产中的应用》中两个主题之间的关系是
A. 应用关系
B. 比较关系
C. 因果关系
D. 影响关系
答案:A. 应用关系
解析:该题名明确表达“计算机”被应用于“农业生产”之中,属于典型的应用关系(工具/技术 → 应用领域)。
- 文献“21世纪美国智能汽车设计”这一主题可以分析为“21世纪”、“美国”、“智能汽车”、“设计”四个主题因素,按照主题分面公式,其标引结果应为
A. 21世纪-美国-智能汽车-设计
B. 美国-智能汽车-设计-21世纪
C. 智能汽车-设计-21世纪-美国
D. 智能汽车-设计-美国-21世纪
答案:D. 智能汽车-设计-美国-21世纪
解析:主题分面标引通常遵循“主体—行为/特性—空间—时间”的引用次序。因此,“智能汽车”(主体)→“设计”(行为)→“美国”(地点)→“21世纪”(时间)为合理顺序。
- 在分类标引工作程序中,第一步应该完成的工作是
A. 主题分析
B. 查重
C. 给号
D. 归类
答案:A. 主题分析
解析:分类标引的第一步是对文献内容进行主题分析,明确其论述对象、研究角度和著述目的,才能准确归类。
- 在主题标引中,使用含义相近的叙词标引是
A. 组配标引
B. 自由词标引
C. 靠词标引
D. 增词标引
答案:C. 靠词标引
解析:靠词标引是指当词表中无专指叙词时,采用上位词或近义词进行标引的方法。
- 《中图法》的类目按照五大部类划分展开,其中“法律”类属于
A. 哲学部类
B. 社会科学部类
C. 自然科学部类
D. 综合性图书
答案:B. 社会科学部类
解析:《中图法》五大部类为:马列主义、哲学、社会科学、自然科学、综合性图书。其中“D 政治、法律”属于社会科学部类。
- 关于《中分表》,表述 错误 的是
A. 《中分表》全称《中国分类主题词表》
B. 《中分表》将分类法与主题法、先组与后组融入一体
C. 《中分表》是一种文献标引和检索工具
D. 《中分表》包括《分类号-主题词对应表》和《分类号-关键词对应表》两部分
答案:D. 《中分表》包括《分类号-主题词对应表》和《分类号-关键词对应表》两部分
解析:《中分表》(《中国分类主题词表》)主要包括《分类号—主题词对应表》和《主题词—分类号对应表》,不包含“关键词对应表”,其核心是受控词汇(叙词),而非自然语言关键词。
- 《文献著录总则》将著录项目规定为两种,分别是主要项目和
A. 基本项目
B. 选择项目
C. 简单项目
D. 次要项目
答案:B. 选择项目
解析:根据国家标准(如GB/T 7714),著录项目分为主要项目(必备)和选择项目(可选)两类。
第二部分 非选择题
二、填空题:本大题共10空,每空1分,共10分。
16. 一般而言,检索系统的检全率和 ▲ 之间是一种互逆关系。
答案:检准率
解析:在信息检索中,检全率(Recall)与检准率(Precision)通常呈反比关系。提高检全率往往引入更多不相关结果,降低检准率;反之亦然。
17. 检索系统中所采用的参照法按照其作用,可以分为单纯参照、▲ 和一般参照三种基本类型。
答案:相关参照
解析:参照法用于揭示词汇间语义关系,通常分为:
- 单纯参照(等同关系,如“用/代”)
- 相关参照(提示相关概念)
- 一般参照(泛指性指引)。
18. 从同一个上位类区分出来的一组处于同等地位的子类称为 ▲ 。
答案:同位类
解析:在分类法中,由同一上位类直接划分出的若干下位类互为同位类,彼此处于同一层级,具有并列关系。
19. 为了保证分类的质量,分类标引工作须遵循准确、充分、▲ 和适用的要求。
答案:一致
解析:分类标引的基本要求通常包括:准确(归类正确)、充分(揭示全面)、一致(相同内容归入相同类目)、适用(符合用户需求)。
20. 叙词表中叙词之间的关系主要有等同关系、▲ 和相关关系。
答案:等级关系
解析:叙词表通过三种语义关系控制词汇:
- 等同关系(用/代)
- 等级关系(属/分、上位/下位)
- 相关关系(参见)。
21. 机读编目 MARC 的英文全称是 ▲ 。
答案:Machine-Readable Cataloging
解析:MARC 是图书馆用于交换书目数据的标准格式,全称为 Machine-Readable Cataloging。
22. 《汉表》是我国第一部大型综合性叙词表,其全名为《▲》。
答案:汉语主题词表
解析:《汉表》是《汉语主题词表》的简称,由中国科学技术信息研究所等单位于1980年编制,是我国首部大型综合性叙词表。
23. 题外关键词索引的英文缩写是 ▲ 。
答案:KWOC
解析:
- KWOC(KeyWord Out of Context):题外关键词索引,关键词置于条目前,上下文不显示;
- 区别于 KWIC(上下文内关键词索引)。
24. 信息描述工作中,按照编目采用的组织形式,目前占主流的方式是 ▲ 和共享编目。
答案:集中编目
解析:现代编目工作主要采用集中编目(由中心机构统一处理)与共享编目(如联机联合编目,OCLC)两种模式,以提高效率与一致性。
25. 直接使用计算机对信息资源进行处理,确定其检索标识的活动称为 ▲ ,也称为计算机标引、机标。
答案:自动标引
解析:自动标引(Automatic Indexing)指利用计算机程序自动提取关键词、主题词或分类号,无需人工干预,是数字环境下重要的信息组织手段。
三、名词解释题:本大题共5小题,每小题3分,共15分。
26. 检索点
答:检索点(Access Point)是指在信息检索系统中,用户可用于查找信息资源的入口或标识。它通常来源于对信息资源的描述或标引结果,如题名、责任者、主题词、分类号、关键词、ISBN 等。检索点必须具有可检性、规范性和唯一性,是连接用户查询与信息资源之间的桥梁。在编目和主题标引中,规范化的检索点有助于提高检索效率和一致性。
27. 知识组织系统
答:知识组织系统(Knowledge Organization System, KOS)是指用于对知识内容进行结构化、组织、表示和管理的一系列工具和方法的总称。其主要类型包括:分类法、主题词表(叙词表)、本体(Ontology)、语义网络、分类主题一体化词表、术语表、分类体系、名称规范档等。KOS 的核心功能是控制词汇、揭示语义关系、支持信息检索与知识发现,广泛应用于图书馆、数字资源库、语义网和人工智能等领域。
28. 组配标引
答:组配标引(Faceted Indexing 或 Post-coordinated Indexing)是指在主题标引过程中,将文献主题分解为若干基本概念因子(如主体、方面、空间、时间等),并分别用相应的叙词或标识符进行标引,检索时再根据需要动态组合这些因子以表达复杂主题的方法。组配标引强调概念的分析与重组,具有灵活性高、专指性强、适应计算机检索等优点,是现代叙词法和分面分类法的核心技术。
29. 叙词
答:叙词(Descriptor 或 Thesaurus Term)是指经过严格规范化处理、用于标引和检索文献主题的受控词汇。叙词具有以下特点:
- 以概念为基础,一词一义;
- 通过等同关系(用/代)、等级关系(属/分)、相关关系(参见)进行语义控制;
- 通常收录于叙词表(Thesaurus)中;
- 支持后组式标引和多维检索。
叙词是现代主题检索语言的核心单元,广泛应用于数据库标引、信息组织与知识管理。
30. 主题分析
答:主题分析是指对信息资源(如图书、论文、报告等)的内容进行深入解读,以识别其论述对象、研究问题、学科属性、写作目的及主题结构的过程。它是分类标引和主题标引的前提和基础,主要包括:
- 判断文献的中心主题与次要主题;
- 区分作者观点与引用内容;
- 识别主题类型(如理论、应用、比较、综述等);
- 确定主题因素及其相互关系(如主体、行为、对象、时空等)。
准确的主题分析是保证标引质量与检索效果的关键环节。
四、简答题:本大题共5小题,每小题6分,共30分。
31. 简述规范控制的作用。
答:
规范控制(Authority Control)是指在信息组织过程中,对名称、主题、术语等检索点进行统一、标准化处理,以确保同一实体或概念在系统中具有唯一、一致、规范的表达形式。其主要作用包括:
- 消除歧义:如“苹果”可指水果或公司,通过规范控制区分;
- 实现集中:将同一主题的不同表达(如“电脑”与“电子计算机”)归并到规范词下;
- 提高检索效率:用户无论使用哪种形式,都能通过规范记录找到全部相关资源;
- 支持系统互操作:为数据交换、联合目录、知识图谱构建提供基础;
- 维护数据一致性:在编目和标引中避免同义词、异形词造成的分散。
规范控制广泛应用于名称规范档、主题词表、分类法及元数据管理中。
32. 图示或者简述文献自动归类的基本步骤。
答:
文献自动归类(Automatic Document Classification)通常包括以下基本步骤:
- 预处理:对原始文本进行清洗,包括分词、去除停用词、词干提取或词形还原等;
- 特征提取:从文本中抽取用于分类的特征项(如关键词、TF-IDF权重、n-gram等),构建特征向量;
- 模型训练(有监督方法):利用已标注类别的训练集,训练分类模型(如朴素贝叶斯、SVM、深度学习模型等);
(若为无监督方法,则跳过此步,直接聚类) - 分类/归类:将待分类文献的特征向量输入模型,由模型预测其所属类别;
- 后处理与评估:对分类结果进行校验、优化,并通过准确率、召回率等指标评估性能。
注:若为无监督自动归类(如聚类),则步骤为:预处理 → 特征提取 → 聚类(如K-means)→ 类簇解释。
33. 简述信息资源分类法的主要编制方式,并列举每种编制方式的典型代表。
答:
信息资源分类法主要有以下三种编制方式:
- 等级列举式分类法(Enumerative Classification)
-
- 特点:预先将知识体系逐级展开,列举所有可能类目,结构固定;
- 代表:《杜威十进分类法》(DDC)、《中国图书馆分类法》(CLC)、《美国国会图书馆分类法》(LCC)。
- 分面组配式分类法(Faceted Classification)
-
- 特点:将知识分解为若干“分面”(如主体、材料、过程、空间、时间等),通过分面组合动态生成类号;
- 代表:《冒号分类法》(CC,由阮冈纳赞创立)、《布利斯书目分类法》(BC2)。
- 半分面分类法(或混合式)
-
- 特点:以等级列举为主,辅以分面复分或组配机制,兼顾系统性与灵活性;
- 代表:《国际十进分类法》(UDC),在DDC基础上引入大量组配符号(如“+”“/”“:”等)实现概念组配。
34. 简述信息组织和信息检索的关系。
答:
信息组织与信息检索是信息管理过程中两个紧密关联、相互依存的环节:
- 信息组织是信息检索的基础:通过分类、编目、标引、元数据描述等手段,对信息资源进行结构化、规范化处理,建立有序的知识体系和检索标识,为高效检索提供前提;
- 信息检索是信息组织的目的和检验标准:组织工作的最终目标是支持用户快速、准确地获取所需信息;检索效果(如检全率、检准率)反过来也检验信息组织的质量;
- 二者协同演进:随着检索技术(如语义检索、AI推荐)的发展,信息组织方式也在向知识图谱、本体、自动标引等智能化方向发展;
- 共同服务于用户需求:无论是组织还是检索,核心都是围绕用户的信息行为与认知习惯,提升信息发现与利用效率。
简言之:“组织为检索服务,检索验证组织成效。”
35. 简述叙词表的作用和特点。
答:
作用:
- 提供规范化的主题标引词汇,实现概念控制;
- 通过语义关系网络(等同、等级、相关)揭示概念间逻辑联系;
- 支持多途径、多维度检索,提高查全率与查准率;
- 作为知识组织工具,支撑数据库标引、知识图谱构建、智能问答等应用。
特点:
- 概念组配性:强调后组式标引,通过叙词组合表达复杂主题;
- 语义控制严格:建立“用(USE)/代(UF)”、“属(BT)/分(NT)”、“参(RT)”等关系;
- 动态可扩展:可根据学科发展增删修订词目;
- 标准化程度高:遵循国际或国家标准(如ISO 25964);
- 面向机器与人双重使用:既供标引员使用,也支持计算机自动处理。
典型代表如《汉语主题词表》《MeSH》(医学主题词表)、《INSPEC Thesaurus》等。
五、综合应用题:本大题共3小题,每小题10分,共30分。
- 著录项目识别题:以下是《管理信息系统分析与设计》一书目录卡片,请根据图书著录格式说明标号①~⑩各项的含义。
管理信息系统分析与设计/蔡淑琴著①.- 北京: ②高等教育出版社③,2016.④
437 页: ⑤25cm.⑥
有书目(第436-437页).⑥
ISBN9 78-7-04-044024-9 ⑦:CNY43.00 ⑧
本书内容:绪论、基本概念、企业信息与数据建模、企业流程及其建模、系统的开发
基础与开发规划、结构化系统分析与结构化系统设计方法等⑨
I. 管... II. 蔡... III. 管理信息系统- 高等学校- 教材 IV. C931.6 ⑩
答:
根据《普通图书著录规则》(GB/T 3792.2-2006)及通用编目规范,各项含义如下:
- ①:责任说明项(责任者)——“蔡淑琴著”表示该书的主要责任者及其责任方式(著);
- ②:出版地——“北京”为出版者所在城市;
- ③:出版者——“高等教育出版社”为图书的出版机构;
- ④:出版年——“2016”表示该书的出版年份;
- ⑤:文献特殊细节项(页码)——“437页”表示图书的正文页数;
- ⑥:载体形态项(开本/尺寸及附注)——“25cm”为图书高度,“有书目……”为附注说明;
- ⑦:标准编号与获得方式项(ISBN)——国际标准书号,用于唯一标识该出版物;
- ⑧:价格——“CNY43.00”表示人民币定价;
- ⑨:内容提要或附注项——对图书内容的简要说明,属于附注的一部分;
- ⑩:排检项与分类号——I、II、III为责任者、题名、主题的排检款目(用于目录组织),IV“C931.6”为《中图法》分类号。
-
**概念关系题:请为下列20个概念建立10组关系并用D S C符号标识关系类型。
**《中国图书馆分类法》、AI DS、出口、初级中学、初中(非正式词)、
分类标引、分类法、海口、海南、化学、
获得性免疫缺乏症(正式叙词)、集中、教育、进口、军事、
民主、有机化学、职业教育、中国军事、主题标引。
答:
在叙词表中,常用符号表示词间关系:
- D(等同关系,即“用/代”关系)
- S(等级关系,即“属/分”关系,S 表示上位词,F 表示下位词;此处统一用 S 表示等级)
- C(相关关系,即“参见”关系)
以下是10组合理关系及符号标识:
- 初中(非正式词) —D— 初级中学
(“初中”是非正式词,应代为正式词“初级中学”) - 有机化学 —S— 化学
(有机化学是化学的下位学科,属等级关系) - 中国军事 —S— 军事
(中国军事是军事的地域分支,属等级关系) - 获得性免疫缺乏症 —D— AIDS
(“获得性免疫缺乏症”是正式叙词,AIDS 为其英文简称或同义词,构成等同关系) - 分类标引 —C— 主题标引
(二者是信息标引的两种不同方法,属相关关系) - 海口 —S— 海南
(海口是海南省的省会,属“城市—省份”的等级关系) - 职业教育 —S— 教育
(职业教育是教育的一种类型,属等级关系) - 出口 —C— 进口
(出口与进口是国际贸易中的对称概念,属相关关系) - 分类法 —S— 《中国图书馆分类法》
(《中图法》是分类法的一种具体形式,属等级关系) - 民主 —C— 军事
(在政治与社会研究中,“民主”与“军事”常存在制度张力或交叉研究,可视为相关关系)
注:AI DS 可能为“AIDS”拼写误差,已按“获得性免疫缺乏症”处理。
- 索引编制题:请为下列文献记录编制主标题倒排档。
登录号 | 标引词 |
---|---|
3001 | 舞蹈 访问演出 俄罗斯 |
3002 | 科技情报 信息技术 中国 美国 |
3003 | 会计 工作人员 培养 上海 |
3004 | 商业道德 对比研究 中国 俄罗斯 |
3005 | 商业 工作人员 商业道德 |
3006 | 信息技术 电子战 俄罗斯 |
3007 | 科技情报工作 对比研究 美国 俄罗斯 |
3008 | 科技情报工作 情报服务 上海 |
3009 | 电子侦察 应用 信息技术 |
3010 | 舞蹈 高等教育 艺术教育 |
答:
主标题倒排档(Inverted File)是将每个标引词作为主标题,其下按字顺排列,并列出包含该词的所有登录号。格式为:
标引词 登录号1, 登录号2, …
编制结果如下:
- 应用 3009
- 艺术教育 3010
- 对比研究 3004, 3007
- 电子战 3006
- 电子侦察 3009
- 高等教育 3010
- 工作人员 3003, 3005
- 会计 3003
- 情报服务 3008
- 科技情报 3002
- 科技情报工作 3007, 3008
- 培养 3003
- 商业 3005
- 商业道德 3004, 3005
- 上海 3003, 3008
- 舞蹈 3001, 3010
- 信息技术 3002, 3006, 3009
- 访问演出 3001
- 俄罗斯 3001, 3004, 3006, 3007
- 美国 3002, 3007
- 中国 3002, 3004
注:标引词按中文拼音字顺排列(此处为便于阅读,按语义分组展示,实际倒排档应严格按字顺排列)