02117 信息组织【第四章】
一、标引与著录
原始内容
- 标引:是对文献进行主题分析,从自然语言转换成规范化的检索语言的过程,即对主题分析结果赋予检索标识的过程。
- 分类标引:就是将文献主题的自然语言形态,转换成分类语言形态的一种标引,也就是将文献主题转换成分类号的一种标引。因此,分类标引是一种直接对文献主题,采用某种号码标识的标引。这种标引是建立分类检索系统的依据。
- 分类标引包括分类和归类两个概念:
○ (1) 所谓分类,就是将大量的图书信息,根据它们的内容性质、形式体裁、立场观点和读者用途上的异同,按照图书分类体系,由上而下,由大到小,由整体到部分,由一般到特殊,由总论到分论的层层划分,这样就可以把相同的图书集中在一起,相近的连接在一起,不同的则区别开来,整理成为有条、有理的系统,在进行时须运用概念的缩小。
○ (2) 所谓归类,即是运用这个体系来分类图书,它是由下而上,由小到大,由部分到整体,由特殊到一般,由分论到总论的集合过程,在进行时须运用概念的扩大。 - 分类标引的优点:
(1) 在于它具有达到较高查全率的族性检索性能,有利于从学科或专业范围角度进行全面检索。
(2) 另一种独特的优越功能就是组织图书资料的排架,其他检索语言就没有这种可能。 - 分类标引的任务:
(1) 揭示每种书、每篇文章的内容性质、形式体裁、立场观点和读者用途,只有这样才能针对不同用户提供所需的不同文献。
(2) 把相同的文献聚集在一起,把不同的文献区别开来,只有这样才能使用户因类以求。
(3) 根据各类文献之间的关系组成一个系统,只有这样才能科学地组织、管理文献。 - 分类标引的要求:
(1) 充分性,即是充分揭示文献的内容、性质、形式和用途。
(2) 针对性,即是文献分类标引必须有的放矢。
(3) 准确性,即要求分类标引做到迅速、及时、不积压。
(4) 一致性,即是说同性质的文献,必须归到同一类;同一种文献的不同复本、版本或卷次必须归到一处。 - 分类标引的一般分类原则(11条,简答题★★★):
(1) 科技图书根据内容性质和形式体裁归类
(2) 文艺作品根据文艺形式体裁归类
(3) 综合性图书根据编制形式体裁归类
(4) 揭示图书内容的政治方向
(5) 根据作者写作目的和书中主要意旨归类
(6) 要遵循图书分类法本身的逻辑性和系统性
(7) 必须保持分类与编目的一致性
(8) 先归入主要类,必要时互见其他类或作分析
(9) 先按学科性质归类,后按地域、时代归类
(10) 一书的研究、评论、解说应随原书归类
(11) 不要单凭书名归类或按临时需要归类 - 两个主题分类标引(P93,简答题★★★):
并列关系(如:动物与植物),
从属关系(如:物理化学及胶体化学),
因果关系(如:血吸虫及血吸虫病),
影响关系(如:植物与光),
比较关系(如:资本主义和社会主义制度的婚姻道德),
应用关系(如:优选法在金属切削中的应用)。
记忆重点 - 基础概念(记“核心动作+结果”):
○ 标引=主题分析+自然转规范语言+赋检索标识;
○ 分类标引=转分类语言(分类号)+建分类检索系统; - 分类 vs 归类(对比记忆,避免混淆):
类型 方向 概念变化 核心逻辑
分类 由上到下、大→小 缩小 划分成系统
归类 由下到上、小→大 扩大 聚集到体系 - 优点(2个独特性,必背):族性检索(高查全率)、图书排架;
- 任务(3条,记关键词):揭示特征、聚同辨异、组成系统;
- 要求(4条,记关键词):充分性、针对性、准确性(及时)、一致性(同归一类);
- 分类原则(11条,简答题用“关键词提炼法”记,避免记长句):
○ 科技=内容+形式;文艺=形式;综合=编制形式;
○ 显政治方向、依作者目的、遵分类法逻辑、分类编目一致;
○ 先主类后互见、先学科后地域时代、评论随原书、不单凭书名/临时需求; - 双主题关系(6种,记“关系类型+简例”,简答题直接对应):
○ 并列(动物-植物)、从属(物理化学-胶体化学)、因果(血吸虫-病);
○ 影响(植物-光)、比较(两制度婚姻道德)、应用(优选法-金属切削)。
二、专业信息部门分类标引
原始内容
针对分类表和本信息机构的特点,在文献处理上应采取如下措施:
(1) 在不违背科学性的基本前提下,尽量进行专业集中
(2) 尽量对有关本专业的资料进行细分
(3) 尽量将与本专业有关的一切文献资料在本专业类目下完全揭示出来。
记忆重点
核心围绕“专业”展开,记“三尽量”+前提:
- 前提:不违背科学性;
- 措施:专业集中、专业细分、专业文献全揭示(3个关键词,无延伸内容,简答题直接罗列)。
三、主题标引
原始内容
- 主题标引:是对文献进行主题分析,并给予主题词标识的过程。
它以文献篇名和文献为依据,必要时参考文献的内容,考虑检索途径的全面性和表达主题的专指性,充分利用词典提供的各种辅助选词手段,充分反映收藏特点和各类用户的要求。 - 标引质量:
(1) 标引的准确性
(2) 标引深度:指对一篇文献所给予的全部检索标识的数量
(3) 标引的一致性:是指同一个标引人员对同一篇文献在不同时间的标引是否一致。 - 标引规则的意义:
标引误差主要源于不遵守标引规则,而检索误差在很大程度上也是由于不了解标引规则。主题标引可分为一般规则、专指性标引规则、组配标引规则、上位词标引规则、近义词和增词标引规则。标引规则是保证标引质量的依据,因此文献标引必须保证质量。标引规则是联系标引者和检索者之间的桥梁。 - 主题标引一般规则(8条,简答题★★★):
(1) 要客观地反映文献所论述的事物或研究对象,不考虑作者立场和观点。
(2) 不能用非正式主题词标引,所使用的主题词,必须是词表中规定的正式主题词。
(3) 以主题分析为依据,不能只依篇名。
(4) 当没有专指主题词时,应选用最相关的主题词组配标引。
(5) 当无法进行组配又无法用上位词标引时,应选用含义最接近的主题词标引。
(6) 标引有机化合物,无主题词时只能用上位词标引,不允许组配。
(7) 需要时可增补主题词进行标引,即增词标引。
(8) 标引结果应按规定著录。 - 主题标引类型表见书P102(一定要记得,常考选择题)
- 标引方案次序选择(固定顺序,简答题/选择题★★★):
(1) 专指性标引 (2) 组配标引 (3) 上位词标引 (4) 近义词标引 (5) 增词标引 - 正确析出文献主题(3条):
(1) 析出的主题必须确切地反映文献内容,不能以大代小或以偏概全。
(2) 析出的主题不能只依题名
(3) 正确析出文献主题词 - 对全文分析和标引(4条):
(1) 为了使标引结果正确而恰当,往往必须浏览全文或读重点章节
(2) 浏览全文是克服过度标引和欠缺标引的依据
(3) 浏览全文是全面摄取有关信息资源的唯一方法
(4) 阅读文章全文方可判定关键词的轻重缓急 - 分组标引:把同一文献中没有直接限定关系的主题词分在不同的组中,这种处理技术称为分组。其目的是为了避免组配元之间产生错误的逻辑误判,即防止虚假组配所造成的误检。
- 上位词标引:是对某些文献主题,在词表中既无专指概念,又无法组配表达时,采用取最近一级直接上位概念来进行标引。
- 适度标引:是指标引出的叙词与原文献主题概念基本一致,既不过度,也不过粗的标引技术。
- 过度标引:是指标引时,不切合文献主题的实际需要,不根据文献内容的实际要求,标引了一些专指性过深或者无实际信息价值的叙词。
- 过粗标引:是指标引时,所标引的主题概念大于原来文献的实际主题概念。
- 靠词标引:靠词标引又称近义标引,是在词表中既无专指概念,也不能组配表达和用上位词标引的情况下,采用在含义上相近的主题词来表达文献主题的一种标引技术。
- 增词标引:当主题表中查不到与标引概念对应的主题词,又需要增加某一主题词时,用新增的主题词标引的方案,称为增词标引。
记忆重点
- 基础核心
● 主题标引=主题分析+赋主题词标识(区别于分类标引的“分类号”);
● 依据:篇名+文献+必要时参考内容,兼顾“检索全面性+主题专指性”。 - 标引质量(3维度,记“定义+关键词”)
● 准确性:标引与文献主题一致;
● 深度:检索标识的数量;
● 一致性:同一人不同时间标引同一文献是否一致。 - 标引规则(核心:保证质量+连接标引者与检索者)
● 规则类型:一般、专指性、组配、上位词、近义词、增词(记名称,不扩展);
● 一般规则(8条,用“关键场景+动作”提炼,避免记长句):
a. 客观反映(不看作者立场);
b. 用正式主题词(非非正式);
c. 依主题分析(不单看篇名);
d. 无专指词→组配标引;
e. 无法组配+无上位词→选最接近词;
f. 有机化合物无词→只用上位词,不组配(特殊规则,必记);
g. 需增补→增词标引;
h. 按规定著录。 - 标引方案次序(固定顺序,记“优先级”)
专指性标引 → 组配标引 → 上位词标引 → 近义词标引 → 增词标引(从精准到补充,不可逆)。 - 全文分析核心
● 关键动作:浏览全文/读重点章节;
● 目的:克服过度标引、欠缺标引,判定关键词轻重缓急。 - 各类标引技术(易混点,记“适用条件+核心特征”)
标引技术 适用条件 核心特征
分组标引 主题词无直接限定关系 防虚假组配→防误检
上位词标引 无专指词+无法组配 取“最近一级上位概念”
适度标引 常规场景 叙词与主题“基本一致”
过度标引 标引不当 专指过深/无价值叙词
过粗标引 标引不当 标引概念“大于”实际主题
靠词标引 无专指词+无法组配+无上位词 用“含义相近”的词(近义)
增词标引 无对应主题词+需新增 用“新增主题词” - 必记细节
● P102主题标引类型表(选择题高频考点,提醒自己看书);
● 析出主题:不依题名、不偏大/偏全、正确选词(3条,记关键词)。
三、组配标引技术
原始内容
- 组配定义:所谓组配,就是把几个主题词按一定的组合方式合理地组合在一起,用来表示达到更专指的主题。
- 组配的作用(6点,简答题★★★):
它是主题词法的重要方法,是提高检索效率的重要措施之一。采用组配可以控制主题词的数量,能比较及时反映新事物和新科学,可以自由扩大和缩小检索范围,可以对同一信息进行多途径检索,能使文献集中而不分散和提高概念的专指性。 - 组配规则(10条,核心考点,简答题★★★):
组配规则是标引规则的核心内容。
(1) 组配必须具有实际检索意义,是概念组配,而不是字面组配
(2) 能进行交叉组配时,不要使用方面组配
(3) 表中已有复合概念的叙词时,不能使用组成这个复合概念单元叙词进行组配
(4) 组配时应用最恰当的概念,而不能越级组配。能用下位概念,就不用上位概念组配
(5) 避免一种组配多种含义
(6) 当主题概念没有专指性叙词的情况下,既可以用上位概念的叙词,又可用泛指叙词组配加以标引时,应以后者,而不用前者
(7) 组配结果要防止虚假组配或虚假联系的产生
(8) 在手工检索中,对文献并列概念主题的组配,应当作两个主题,分别予以组配,在组配中允许同一叙词重复使用
(9) 组代组配
(10) 化合物、合金等组配 - 组配选词与符号:
(1) 组配选词:正确选用主题词,剔除多余的词
(2) 组配符号(P117-118,选择题高频考点):
A. 同级词组配,用“+”号
B. 自然词序用“——”号
C. 倒置词序用“,”号
D. 事物与其特征词组配,用“·”号
E. 事物主题词与说明语组配,用“·”号并加“#”号 - 字面组配:
指的是单纯字面组配,所谓单纯字面组配,这是指那些单纯从字面的拼合形式出发,而不考虑概念之间的逻辑关系和语法关系的组配。
字面组配的实质是词的分析与组合;概念组配,其实质是概念的分析与综合,两者的检索效果是有很大差异的。 - 概念组配:
所谓组配标引是指采用几个叙词的组合形式,对文献的内容特征进行的标引。但组配的叙词之间必须具有概念上的某种逻辑关系。
(1) 概念交叉组配:交叉组配是指参加组配的概念,属于限定组配的性质,而又有共同的上位概念的组配,称为交叉组配。如:“喷气式飞机”与“垂直起落飞机”组配“喷气式垂直起落飞机”
(2) 概念限定组配:是指参加组配的概念在内涵上不同,而外延有部分重叠的组配,称为概念限定组配。如:“汽车”与“理论”组配成“汽车理论”
(3) 概念并列组配:是指两个或两个以上具有概念并列关系的同级叙词之间的组配,组配结果形成一个属概念,即原来用以组配的两个或两个以上概念的上位概念。如:“汽车”,“拖拉机”组配出“汽车与拖拉机”
记忆重点
- 核心定义与作用
● 组配目的:实现更专指的主题;
● 作用(记6个关键词):控词量、映新事物、扩缩范围、多途径检索、聚文献、提专指性(简答题直接罗列,无需长句)。 - 组配规则(10条,提炼“关键要求”,避免记长句)
- 必为概念组配(非字面);
- 优先交叉组配(不用方面组配);
- 有复合叙词→不拆单元词;
- 用恰当概念(不越级,优先下位);
- 避免一配多义;
- 无专指词→用泛指组配(不用上位词);
- 防虚假组配;
- 手工检索并列主题→分两组配(允许叙词重复);
- 组代组配;
- 化合物/合金特殊组配。
- 组配符号(表格对比,一目了然)
符号 用途 示例(可联想)
- 同级词组配 汽车+拖拉机
—— 自然词序 汽车——理论
, 倒置词序 理论,汽车(对应上)
· 事物+特征词 汽车·红色
·# 事物主题词+说明语 汽车·#新能源
- 字面组配 vs 概念组配(对比记忆,易混点)
类型 核心逻辑 实质 检索效果
字面组配 仅字面拼合,无逻辑关系 词的分析与组合 差
概念组配 需有概念逻辑关系 概念的分析与综合 好 - 概念组配三类型(记“关系+例子”,简答题对应)
● 交叉组配:有共同上位概念,组配后更专指(喷气式飞机+垂直起落飞机→喷气式垂直起落飞机);
● 限定组配:内涵不同、外延重叠,限定主题(汽车+理论→汽车理论);
● 并列组配:同级并列概念,组配后成上位概念(汽车+拖拉机→汽车与拖拉机)。
四、著录
原始内容
- 文献信息著录:在编制文献目录时,对文献信息的各种特征进行分析、选择和记录的过程。
○ 文献的内容特征:分类、主题
○ 文献的外表特征:题名、著者、来源出处、出版地、出版者、出版时间
○ 文献的物质特征:文献类型、页册数、图表、开本、装订、价格 - 核心概念:
○ 文献:记录有知识的一切载体
○ 款目:著录的结果,是反映文献内容和形式特征的著录项目的组合。
○ 目录:将一批款目按照一定的次序编排而成的一种文献报道和检索工具。 - 著录项目与格式:
○ 著录项目:P122(选择题高频考点,需看书熟悉具体项目)
○ 著录格式:P125(重点,选择题/实操题可能涉及,需看书掌握格式规范) - 著录详简级次:
(1) 著录项目,区分为主要项目和选择项目:
○ 主要项目:题名与责任者项的正题名、第一责任者;版本项:出版地或发行地、出版者或发行者、出版日期或发行日期;载体形态项
○ 选择项目:并列题名、副题名及说明题名文字、文献类型标识、其他责任者;
(2) 著录详简级次,区分为简要级次、基本级次和详细级次:
○ 凡款目仅著录主要项目的称为简要级次或第一著录级次。
○ 凡款目除著录主要项目外,还著录部分选择项目的称为基本级次或第二著录级次
○ 凡款目著录主要项目和全部选择项目的称为详细级次或第三著录级次。
记忆重点
- 著录核心与文献特征
● 著录动作:分析、选择、记录文献特征;
● 三大特征(必背,选择题/简答题高频):
○ 内容特征:分类、主题;
○ 外表特征:题名、著者、来源、出版地/者/时间;
○ 物质特征:类型、页册数、图表、开本、装订、价格。 - 核心概念(记“定义关键词”)
● 文献=记录知识的一切载体;
● 款目=著录结果(特征项目组合);
● 目录=款目按次序编排(报道+检索工具)。 - 著录详简级次(记“级次→对应项目”,避免混淆)
级次类型 别名 对应项目
简要级次 第一著录级次 仅主要项目
基本级次 第二著录级次 主要项目+部分选择项目
详细级次 第三著录级次 主要项目+全部选择项目 - 必记细节
● 著录项目(P122)、著录格式(P125):提醒自己看书熟悉,选择题常考具体项目/格式规范,避免遗漏。