参考文献标准中与永久标识相关的PID、URN、DOI等概念的理解和区分
PID、URN、DOI等概念的理解和区分
最近在针对最新版参考文献国标(GB/T 7714-2025)实现biblatex参考文献样式时,遇到如永久标识符(persistent identifier,PID)等一些概念,前期虽有了解,但实际上并没有真正理解。所以本文做进一步的梳理。
PID、URN、DOI等概念
PID (persistent identifier) 是永久标识符,用于数字资源的长期引用。联合国教科文组织(United Nations Educational, Scientific and Cultural Organization, UNESCO)于 2021年11月23日在第41届大会上通过"开放科学建议书"(RECOMMENDATION on OPEN SCIENCE)。永久标识符(persistent identifier)作为开放科学重要基础设施之一被首次提出,强调要持续稳定运行永久标识符系统。
DOI (Digital Object Unique Identifier) 是数字对象标识符。DOI 由 International DOI Foundation 组织提供。DOI 面向任何对象-物理,数字或抽象,被设计用来给人类和机器持续跟踪对象或事物。事物可以是物质、材料、内容或活动。DOI 作为一个唯一的数字,由前缀和后缀组成,由前斜杠分隔,比如: 101000/182。它们允许唯一地识别和可靠地访问事物。
URN (Uniform Resource Name) 是统一资源名。互联网工程工作组 (The Internet Engineering Task Force, IETF) 于 1993年3月所提出的统一资源命名计划 (Uniform Resource Names) ,用于解决互联网资源链接问题,不再只是互联网资源地址的指定,而是给予互联网资源一个永久性的名称,以适应互联网资源发展需求。URN 由NID (Namespace Identifier) 和 NSS (Namespace Specific String) 构成,NID 由参与URN计划的组织和单位在 IANA ( Internet Assigned Numbers Authority ) 注册,NSS 由这些单位自行决定命名方式。
PID、URN、DOI等的差异和对比
这三个概念实际是从不同角度提出的概念。
PID 强调引用的持久不变性,不论这种持久不变性是什么形式,由什么组织或机构实现。
DOI 强调对象标识的唯一性,可以看做是由 International DOI Foundation 组织提供的资源身份证信息,该组织维护DOI系统来为数字资源提供唯一的、永久的标识符,以方便资源的检索、引用和链接。
URN 是从互联网资源角度强调资源名的统一性和唯一性,也就是同一资源无论放到哪里(访问网址是否相同,是否有效)都有相同的名称,也可以看做是一种身份证信息。(与URN相关的URI,URL可以找资料详细了解,这里不再说明。)
注意到 DOI 实际上也在URN的注册列表中,所以DOI实际上也可以看做是URN的一种实现。
同时 DOI 也支持对数字资源的长期引用,所以 DOI 也可以看做是 PID 的一种实现。
PID 作为开放科学建议的载体,存在不同实现。CSTR (Common Science and Technology Resources) 就是与 DOI 类似的这样一种实现,它是全球通用科技资源标识符,也是全球科技资源唯一标识的贡献者与全球开放科学的实践者。除此之外,ISBN (International Standard Book Number)、ArXiv 等都可以视作是PID的实现。
PID、URN、DOI等概念的总结
由于 DOI、ISBN 等既在 URN Namespaces 中,也被视作支持PID的永久标识符。
所以,从这一关系看,上述概念可以做如下更容易理解的总结:PID 和 URN 是更高层的面向唯一资源描述与访问的某些计划或目标实现的载体,只是前者主要面向科技资源,后者面向互联网资源,前者强调永久存取,后者强调统一命名。而 DOI 、CSTR、ISBN 等可以看做是支撑这些高层目标的底层实现。这种实现带有多功能性,比如,既可支持永久存取,也支持统一命名。当底层实现满足不同高层计划的要求时,则都可以看做是该计划的具体实现。
高层计划载体:
对比项 | PID | URN |
---|---|---|
来源计划 | 联合国教科文组织的开放科学计划 | 互联网工程工作组的统一资源命名计划 |
面向对象 | 科技资源 | 互联网资源 |
侧重方向 | 永久存取 | 统一命名 |
科技资源永久标识的底层实现:
对比项 | DOI | CSTR | ArXiv |
---|---|---|---|
组织 | https://doi.org/ | https://www.cstr.cn/ | https://arxiv.org/ |
注意到:同一个资源可以在不同的实现中有不同的标识,也就是同一个对象在不同系统中分配了不同的身份证。说明同一资源可以有不同的永久标识符,这些不同的标识符来自于不同的组织。
这些不同组织提供的系统尽管都是为了相同或类似的目标,但实际上存在话语权的问题。谁影响更大更通用,可能就会有更大的话语权。
CSTR 是我国基于联合国开放科学计划的一种实现,也是未来我国在这一领域提升话语权的重要路径,国人可以多支持。
参考:
- https://www.doi.org/the-identifier/what-is-a-doi/
- https://www.cstr.cn/search/intro/
- https://content.teldap.tw/index/blog/?p=304
- https://www.iana.org/assignments/urn-namespaces/urn-namespaces.xhtml
- https://developer.aliyun.com/article/1110173
- https://info.orcid.org/zh-CN/%E6%96%87%E4%BB%B6/%E6%95%B4%E5%90%88%E6%8C%87%E5%8D%97/orcid-%E5%92%8C%E6%8C%81%E4%B9%85%E6%A0%87%E8%AF%86%E7%AC%A6/
- https://pub.orcid.org/v3.0/identifiers