当前位置: 首页 > news >正文

参考文献标准中与永久标识相关的PID、URN、DOI等概念的理解和区分

PID、URN、DOI等概念的理解和区分

最近在针对最新版参考文献国标(GB/T 7714-2025)实现biblatex参考文献样式时,遇到如永久标识符(persistent identifier,PID)等一些概念,前期虽有了解,但实际上并没有真正理解。所以本文做进一步的梳理。

PID、URN、DOI等概念

PID (persistent identifier) 是永久标识符,用于数字资源的长期引用。联合国教科文组织(United Nations Educational, Scientific and Cultural Organization, UNESCO)于 2021年11月23日在第41届大会上通过"开放科学建议书"(RECOMMENDATION on OPEN SCIENCE)。永久标识符(persistent identifier)作为开放科学重要基础设施之一被首次提出,强调要持续稳定运行永久标识符系统。

DOI (Digital Object Unique Identifier) 是数字对象标识符。DOI 由 International DOI Foundation 组织提供。DOI 面向任何对象-物理,数字或抽象,被设计用来给人类和机器持续跟踪对象或事物。事物可以是物质、材料、内容或活动。DOI 作为一个唯一的数字,由前缀和后缀组成,由前斜杠分隔,比如: 101000/182。它们允许唯一地识别和可靠地访问事物。

URN (Uniform Resource Name) 是统一资源名。互联网工程工作组 (The Internet Engineering Task Force, IETF) 于 1993年3月所提出的统一资源命名计划 (Uniform Resource Names) ,用于解决互联网资源链接问题,不再只是互联网资源地址的指定,而是给予互联网资源一个永久性的名称,以适应互联网资源发展需求。URN 由NID (Namespace Identifier) 和 NSS (Namespace Specific String) 构成,NID 由参与URN计划的组织和单位在 IANA ( Internet Assigned Numbers Authority ) 注册,NSS 由这些单位自行决定命名方式。

PID、URN、DOI等的差异和对比

这三个概念实际是从不同角度提出的概念。

PID 强调引用的持久不变性,不论这种持久不变性是什么形式,由什么组织或机构实现。

DOI 强调对象标识的唯一性,可以看做是由 International DOI Foundation 组织提供的资源身份证信息,该组织维护DOI系统来为数字资源提供唯一的、永久的标识符,以方便资源的检索、引用和链接。

URN 是从互联网资源角度强调资源名的统一性和唯一性,也就是同一资源无论放到哪里(访问网址是否相同,是否有效)都有相同的名称,也可以看做是一种身份证信息。(与URN相关的URI,URL可以找资料详细了解,这里不再说明。)

注意到 DOI 实际上也在URN的注册列表中,所以DOI实际上也可以看做是URN的一种实现。
同时 DOI 也支持对数字资源的长期引用,所以 DOI 也可以看做是 PID 的一种实现。

PID 作为开放科学建议的载体,存在不同实现。CSTR (Common Science and Technology Resources) 就是与 DOI 类似的这样一种实现,它是全球通用科技资源标识符,也是全球科技资源唯一标识的贡献者与全球开放科学的实践者。除此之外,ISBN (International Standard Book Number)、ArXiv 等都可以视作是PID的实现。

PID、URN、DOI等概念的总结

由于 DOI、ISBN 等既在 URN Namespaces 中,也被视作支持PID的永久标识符。
所以,从这一关系看,上述概念可以做如下更容易理解的总结:PID 和 URN 是更高层的面向唯一资源描述与访问的某些计划或目标实现的载体,只是前者主要面向科技资源,后者面向互联网资源,前者强调永久存取,后者强调统一命名。而 DOI 、CSTR、ISBN 等可以看做是支撑这些高层目标的底层实现。这种实现带有多功能性,比如,既可支持永久存取,也支持统一命名。当底层实现满足不同高层计划的要求时,则都可以看做是该计划的具体实现。

高层计划载体:

对比项PIDURN
来源计划联合国教科文组织的开放科学计划互联网工程工作组的统一资源命名计划
面向对象科技资源互联网资源
侧重方向永久存取统一命名

科技资源永久标识的底层实现:

对比项DOICSTRArXiv
组织https://doi.org/https://www.cstr.cn/https://arxiv.org/

注意到:同一个资源可以在不同的实现中有不同的标识,也就是同一个对象在不同系统中分配了不同的身份证。说明同一资源可以有不同的永久标识符,这些不同的标识符来自于不同的组织。
这些不同组织提供的系统尽管都是为了相同或类似的目标,但实际上存在话语权的问题。谁影响更大更通用,可能就会有更大的话语权。
CSTR 是我国基于联合国开放科学计划的一种实现,也是未来我国在这一领域提升话语权的重要路径,国人可以多支持。

参考:

  1. https://www.doi.org/the-identifier/what-is-a-doi/
  2. https://www.cstr.cn/search/intro/
  3. https://content.teldap.tw/index/blog/?p=304
  4. https://www.iana.org/assignments/urn-namespaces/urn-namespaces.xhtml
  5. https://developer.aliyun.com/article/1110173
  6. https://info.orcid.org/zh-CN/%E6%96%87%E4%BB%B6/%E6%95%B4%E5%90%88%E6%8C%87%E5%8D%97/orcid-%E5%92%8C%E6%8C%81%E4%B9%85%E6%A0%87%E8%AF%86%E7%AC%A6/
  7. https://pub.orcid.org/v3.0/identifiers

相关文章:

  • 【MyBatis-11】MyBatis批处理:提升数据操作性能的利器
  • 【LeetCode 热题100】17:电话号码的字母组合(详细解析)(Go语言版)
  • 【typenum】 11 私有模块(private.rs)
  • 开机自启rc.local
  • ctr查看镜像
  • 需求文档不完整,如何确保开发理解一致?
  • STM32八股【9】-----volatile关键字
  • 学习!FastAPI
  • ubuntu安装vmware启动虚拟机失败
  • 计算机组成与体系结构:缓存一致性(Cache Coherence)
  • 第四章:WebSocket 通信机制全解与客户端发包实录
  • BOM知识点
  • 线程池学习笔记
  • Linux系统编程——system函数和popen函数的使用方法以及区别
  • 三维重建(二十三)——各种参数的测试(废案)
  • IIS入门指南:原理、部署与实战
  • 容器化:用于机器学习的 Docker 和 Kubernetes
  • SRIO(Serial RapidIO)握手流程
  • 算符优先分析之输入串分析
  • 【深度学习】残差网络(ResNet)
  • 国家统计局答澎湃:我国投资的潜力依然巨大,支撑投资增长的有利因素仍然比较多
  • 官方数据显示:我国心血管疾病患者已超3亿人
  • 有关“普泽会”,俄官方表示:有可能
  • 澎湃与七猫联合启动百万奖金征文,赋能非虚构与现实题材创作
  • 深圳南澳码头工程环评将再次举行听证会,项目与珊瑚最近距离仅80米
  • 特朗普中东行:“能源换科技”背后的权力博弈|907编辑部