当前位置: 首页 > news >正文

02117 信息组织【第三章】

一、标题法
原始内容

  1. 标题法是以主题语言为基础描述和表达信息内容的一种信息处理方法。
  2. 所谓主题语言,是指以自然语言的字符为字节,以名词术语为基本词汇,用一组名词术语作为检索标识的一类检索语言。
    主题语言的发展经历了一个由严格规范到自由组配再到适当规范的过程。主题法是文献检索工作中两大检索方法之一,它是一种文献主题标引和查找文献的依据。
  3. 标题法的含义:这是主题法的最早类型,也称传统式主题法,又称字顺主题分类语言。文献主题的内容是用规范化的词或词组来标识。这个词或词组就是所谓文献的标题。把它们按字顺排列起来就成为标题表。
  4. 标题词组词语法(7种类型):
    ○ 正叙式(如:DIESEL EGINES 柴油机)
    ○ 倒叙式(如:PIPE, COPPTER 钢管)
    ○ 并列式(如:BOLTS AND NUTS 螺栓和螺帽)
    ○ 形容词+名词(如:Optical Properties 光学性质)
    ○ 动词+名词(如:Amplitude Modulation 调幅)
    ○ 名词+名词(如:Electron Beams 电子束)
    ○ 名词+介词+名词(如:Flow of Fluids 流体流动)
    ○ 复合名词+动名词(如:Coal mines and Mining 煤矿与采矿)
  5. 标题语言的缺点:
    (1) 缺乏按学科专业概念进行族性检索的能力。
    (2) 缺乏描述复杂概念较高专指度的能力。
    (3) 缺乏具有多种途径检索和自由扩检的能力,扩检和缩检能力弱。
    记忆重点
  6. 核心关联:标题法→基于主题语言,主题语言三要素:自然语言字符、名词术语(基本词汇)、一组名词术语(检索标识);
  7. 标题法本质:传统式+规范化词/词组+字顺排列(记“传统、规范、字顺”三个关键词);
  8. 词组语法:按“结构类型+简例”记,无需全背英文,重点区分“正叙(直接表述)”“倒叙(中心词前置,逗号分隔)”“并列(and连接)”;
  9. 缺点:记“三缺”——缺族性检索、缺高专指度、缺多途径检索/扩缩检能力(简答题直接用,条理清晰)。

二、叙词法
原始内容

  1. 叙词的含义:叙词语言是以规范化科学名词作为基础的一种主题法检索语言。以主题词(叙词)作为文献内容标识和查找的依据。它是从自然语言中优选出来的经过规范化处理的名词术语。它是一种后组式语言。
  2. 叙词的性能:叙词的优异性能,首先在于它是一种后组式检索语言,可以自由地进行广泛的组配,形成各种专指标识,扩大或缩小检索范围,以及进行多维性、多途径检索等。
  3. 叙词法的基本原理(3条):
    (1) 保留了单元词组配的基本原理。
    (2) 采用了标题法对词语进行严格规范化的方法,以保证词与概念的一一对应。
    (3) 采用了体系分类法的基本原理,编制叙词分类索引(范畴索引)和等级索引(词族索引)。
  4. 叙词的作用(简答题★★★,P48需补充内容):
    直观性,单义性,组配性,网罗性和专指性,多维检索性,语义关联性,计算机检索与手工检索的兼容性,现代科学技术的适应性。
    记忆重点
  5. 叙词核心:规范化科学名词+后组式语言(“后组式”是与标题法的关键区别,可自由组配);
  6. 基本原理:记“三借鉴”——借单元词组配、借标题法规范化、借体系分类法原理(对应两个索引:范畴索引、词族索引);
  7. 作用(简答题必背,记8个关键词):直观、单义、组配、网罗专指、多维检索、语义关联、兼容(机手检)、适配(现代科技)(补充内容可围绕“组配灵活性”“规范化优势”展开,如“组配性可精准定位复杂主题,单义性避免一词多义导致的检索误差”)。

三、叙词表
原始内容

  1. 叙词表的体系结构(5部分,简答题★★★):
    (1) 叙词字顺表:又称叙词表的主表。它给出叙词表收录的全部叙词和非叙词,并有标注事项和显示词间关系的参照系统。
    (2) 分类索引:又称范畴索引。将叙词按其概念所属学科或范畴分成若干大类,在大类下再分小类,在小类下则将叙词按字顺排列,形成一个类似体系分类表的概念分类系统。
    (3) 等级索引:又称词族索引。利用概念的属分关系,将具有属分关系的叙词汇集在一起成为一族,构成一个从泛指词到专指词的等级关系。
    (4) 双语种对照索引:提供了另一种语言字顺入手查词的途径。
    (5) 附表:它是主表的一种特殊形式,是主表主题词的组成部分。
  2. 主题词款目实例(P50属分类图):
    款目包含8项:A.款目主题词 B.范畴号 C.用代词和组代词 D.属分项 E.参照 F.族首词项 G.词义注释 H.范围注释。
    叙词表作用:把款目主题词、汉语拼音、英文译名、范围分类号、注释和参照项等组成款目结构。
    检索语言/词条作用:控制标引与检索用语,使同一主题或相关主题的文献集中,并通过系统化组织文献。
  3. 范畴索引:
    是将主表的全部主题词按照学科和词义范畴,划分为若干大类、二级类或三级类,每类之下再依主题词的汉语拼音字顺排列的一种索引。
    《汉语主题词表》范畴索引共设置五大部58个大类,674个二级类,1080个三级类。
    范畴索引的分类原则:以学科为主,词义为辅,把学科性质和概念性质相近的主题词归并在一起。
  4. “范畴索引”类目的标记符号(3种):
    (1) 双位数字法 (2) 双位字母法 (3) 字母与数字相结合的方法。
  5. 范畴索引的作用(3条):
    (1) 从分类角度查找主题词,作为标引和检索图书资料的辅助工具。
    (2) 对图书资料进行分门别类编辑、通报、交流、发行和组织手检分类主题目录的工具。
    (3) 作为编制主题词表的辅助工具,对选词、编制参照等工作起分工协调和检查遗漏的作用。
    记忆重点
  6. 体系结构(简答题必背,记“名称+核心功能”):
    ○ 主表=叙词字顺表(全量叙词+非叙词+参照);
    ○ 分类索引=范畴索引(学科/范畴分类+字顺);
    ○ 等级索引=词族索引(属分关系,泛指→专指);
    ○ 双语对照=多语言查词;
    ○ 附表=主表补充;
  7. 范畴索引关键:
    ○ 分类原则:学科为主,词义为辅;
    ○ 数量(《汉语主题词表》):五大部58大类(记核心数字,二级/三级类无需硬背);
    ○ 标记符号:双位数字、双位字母、字母+数字(3种,不遗漏);
    ○ 作用:记“查词辅助、编目工具、词表编制辅助”(3条,对应标引、编目、词表三个场景)。

四、词族索引
原始内容

  1. 词族索引的含义:词族索引又称族系索引、等级索引、词族表。它是主表中具有种族关系、部分与整体关系和包含关系的正式主题词,按其本质性能展开全显示的一种词族系统。即这一词族中概念最大的主题词,叫做族首词,或叫做顶端主题词。
  2. 词族索引的款目结构:将全部词族索引以族首词款目的字顺和等级相结合的方法表示的称为词族索引。族首词就是指能概括一族主题词的最上位概念的词,它列在一族之首,并在其右上角有“*”号。
  3. 词族索引的作用:
    (1) 满足族性检索需要;
    (2) 起自动扩检和缩减的作用;
    (3) 限定词义,提高标引和检索时选词的准确性、专指性。
    记忆重点
  4. 核心定义:记“三关系”(种族、部分整体、包含)+“族首词”(最上位概念,标“*”);
  5. 作用(简答题必背):直接记三个关键词——族性检索、扩检缩检、提高准确专指性(无需展开长句,抓核心功能)。

五、英汉对照索引
原始内容
英汉对照索引:就是将英文与汉语主题词互相对应,并按英文字母顺序排列的一种索引。
《汉语主题词表》的英汉对照索引分为六大块,即:主表主题词表的英汉对照索引(2块)和附表主题词表英汉对照索引(4块)。
记忆重点

  1. 核心特征:英汉对应+英文字母排序;
  2. 结构(《汉语主题词表》):记“6大块=主表2块+附表4块”(仅记数量和分类,不扩展细节)。

六、附表
原始内容
附表:附表是主表的一种特殊形式,是主表主题词的组成部分。
记忆重点
直接记核心定位:主表的特殊形式+主表主题词的组成部分(内容简单,无延伸考点)。

七、关键词
原始内容

  1. 关键词的含义:所谓关键词,是从文献资料的正文、摘要或书名、篇名中抽出的并在表达文献内容主题方面具有实在意义起关键性作用的词汇。因为这些具有实质意义的词汇,对能否检索到这篇文献起着关键性的作用,所以称为关键词。
  2. 关键词的性质(4点):
    (1) 关键词与标题词、单元词、叙词同属主题法系统的检索语言。
    (2) 关键词法基本上不作规范化处理,或仅作极少的规范化处理。其明显不同是:标题词、单元词和叙词都需要表,关键词则不存在所谓的表。
    (3) 关键词是文献中现成的词汇,是一种自然语言。因而,关键词能够达到任意的专指度和泛指度。
    (4) 关键词是一种非控制的语言,因而能用计算机进行自动抽词标引,这样可大大加速文献的标引过程。
  3. 关键词的规范(4点):
    关键词方法的基本原理,是把信息的主题分拆为单位概念,然后对这些概念加以组配,以实现信息的存储和检索。
    (1) 对非关键词进行规范,编制非关键词表。
    (2) 对文献题名作必要修改。
    (3) 对一些词和符号进行改写。
    (4) 缩略与拆词。
  4. 关键词的缺点(4点,简答题★★★):
    (1) 同义词语近义词的问题;
    (2) 同一主题的文献可能分散在不同的关键词名下,因而可能产生漏检,影响查全的效果;
    (3) 表达主题的专指性、准确性较差,因而容易产生误检,影响查准的效果;
    (4) 计算机检索时,需要扫描的款目较多,因此,关键词索引比较适用于数量不太多的文献。
    记忆重点
  5. 含义核心:来源(正文/摘要/书名篇名)+ 作用(关键意义);
  6. 性质(与标题词/叙词的核心区别):记“三非”——非规范(少规范)、非需表、非控制语言,加“一能”(计算机自动标引);
  7. 规范措施:直接记4个关键词——编非关键词表、改题名、改词/符号、缩略拆词;
  8. 缺点(简答题必背):记“四问题”——同义近义词、漏检(查全差)、误检(查准差)、适用于少量文献(条理清晰,对应查全率、查准率考点)。

八、题内关键词
原始内容

  1. 题内关键词的含义:就是从文献篇名中抽取的关键词为题内关键词。英文名称为Keyword in Context Index, 简称KWIC。
  2. 题内关键词的特点:
    ○ 优点:
    (1) 在列出关键词时,同时保留了题目中的非关键词,而且词序不变。使检索者对题目中的各个关键词之间语法关系有清晰了解,帮助检索者更好地理解文献的中心内容。
    (2) 由于这种索引便于采用计算机编排,因而编制容易,速度快,报道传播信息及时。
    ○ 缺点:
    (1) 同义词、单复词无法规范。因而使同一主题的文献,因关键词的词形不同而被分散,影响查全的性能。
    (2) 揭示文献的专指性、准确性受到影响。由于抽词主要取决于文章题目,因此可能使许多重要信息得不到充分反映。
    记忆重点
  3. 核心定位:来源(仅篇名)+ 简称KWIC(区别于普通关键词的“多来源”);
  4. 优缺点(对比记忆,避免混淆):
    ○ 优点:保留语法关系(助理解)、计算机编快(传讯及时);
    ○ 缺点:同义词不规范(查全差)、抽词限题目(信息不充分)。

九、题外关键词
原始内容

  1. 题外关键词的含义:除题名外,从文献正文中抽取的关键词,称为题外关键词。这种索引的英文名称为“Keyword out of Context”,简称“KWOC”。
  2. 题外关键词索引是为了克服题内关键词索引存在缺点而编制的一种索引,最大特点是关键词的抽词不局限于文章的标题,包括从文摘甚至正文中抽取最能反映文献主题内容的关键词。抽出的几个关键词也采取轮流编排,但没有上下文结构,节省了索引的篇幅。
    记忆重点
  3. 核心区别:与题内关键词(KWIC)对比,抽词来源不局限于篇名(扩展到正文/文摘);
  4. 关键特征:简称KWOC、无上下文(省篇幅)、克服题内关键词缺点;
  5. 无需记复杂细节,抓“来源扩展+简称+核心优势”即可。

十、参照系统
原始内容
● Y(用)——USE
● D(代)——UF
● S(属)——BT
● F(分)——NT
● Z(族)——TT
● C(参)——RT
● See 的含义:“S”就是把不是主题词的词,通过它引见到作为主题词的词。
● See Also:用它来联系相关的主题词,进一步扩大检索的范围。
2. See的实例见P68
记忆重点
(高频考点,必须记“符号-中文-英文”三者对应,避免混淆)

  1. 核心对应关系:
    ○ Y(用)= USE(指引非主题词到主题词);
    ○ D(代)= UF(主题词的替代词,如同义词);
    ○ S(属)= BT(上位概念词,如“苹果”的属是“水果”);
    ○ F(分)= NT(下位概念词,如“水果”的分是“苹果”);
    ○ Z(族)= TT(族首词,统领一族词);
    ○ C(参)= RT(相关概念词,扩大检索);
  2. See vs See Also:
    ○ See=引向主题词(定方向);
    ○ See Also=联系相关词(扩范围)。

十一、叙词与叙词、非叙词间概念逻辑关系(P70)
原始内容
(1) 同一关系:同义词,近义词,多义词
(2) 等级关系
(3) 相关关系
记忆重点
直接记三种关系:同一、等级、相关(无延伸内容,简答题按此三点作答即可);
● 同一关系:核心是“词不同但概念同”(如“土豆-马铃薯”);
● 等级关系:核心是“概念有上下位”(如“水果-苹果”);
● 相关关系:核心是“概念有关联但非同一/等级”(如“电脑-键盘”)。

十二、分类主题一体化词表类型
原始内容
分类主题一体化词表大致可以分为以下三种类型:
(1) 分面叙词表
(2) 分类主题词表
(3) 集成词表
记忆重点
直接记三种类型名称:分面叙词表、分类主题词表、集成词表(无细节扩展,选择题/简答题直接罗列)。

http://www.dtcms.com/a/481833.html

相关文章:

  • 自己建设淘宝客网站需要备案么wordpress插件 投票
  • Wireshark 4.4.9 设置为中文界面方法
  • 极限AI Coding,腾讯云“黑客松”大赛回顾(内有作品开源)
  • 【工具分享】Dota游戏平台助手
  • 网站制作找云优化口碑好的网站定制公司
  • 精品建站公司2345网址大全下载到桌面
  • HENGSHI SENSE异构过滤架构:基于三层执行引擎的跨源联邦查询性能优化实践
  • 语言模型监督式微调(SFT)概述
  • 又开始了 小程序定制
  • 前端面试-箭头函数
  • 翻译类公司网站模板node做网站后台
  • 2018做网站哪里可以做寄生虫网站
  • 腾讯云的游戏盾怎么样
  • C++函数完全指南:从基础到高级应用
  • 国自然申报·医工交叉热点|单细胞多模态融合破解病理研究痛点
  • html情人节给女朋友做网站WordPress在手机能更新
  • springboot餐厅信息管理系统设计(代码+数据库+LW)
  • Jenkins Share Library教程 —— 高级实战与最佳实践教程
  • Blender图片AI智能一键生成3D模型插件 Pixelmodeller Ai V1.4.9
  • CAA机器学习
  • LeetCode hot100:128 最长连续序列:高效求解
  • 上海网站制作 优化wordpress 去除google
  • [Backstage] 软件模板Scaffolder | 定义“Node.js微服务“
  • 链表操作教学工具
  • 珠海市网站建设的公司网站安全维护
  • PC端AI推理存储IO流量剖析
  • 如何在AutoCAD中管理GIS属性表?
  • 消防模块-图形识别快速匹配
  • 备案网站名怎么写前端微信小程序开发
  • 使用Spring Boot构建多维度配置层