数据目录词汇表 (DCAT) - 版本 3

W3C 推荐标准

有关本文档的更多详细信息
本版本:
https://www.w3.org/TR/2024/REC-vocab-dcat-3-20240822/
最新发布版本:
https://www.w3.org/TR/vocab-dcat-3/
最新编辑草案:
https://w3c.github.io/dxwg/dcat/
历史:
https://www.w3.org/standards/history/vocab-dcat-3/
提交历史
实现报告:
https://w3c.github.io/dxwg/dcat3-implementation-report/
上一版推荐标准:
https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/
编辑:
Riccardo Albertoni (受邀专家 / CNR - 意大利国家研究委员会,意大利)
David Browning (受邀专家) (之前任职于 Refinitiv.com)
Simon J D Cox (受邀专家) (之前任职于 CSIRO)
Alejandra Gonzalez Beltran (受邀专家 / 科学 计算部门,英国科学技术设施委员会,英国) (之前任职于 牛津大学)
Andrea Perego (受邀专家)
Peter Winstanley (受邀 专家)
前任编辑:
Fadi Maali (DERI)
John Erickson (Tetherless World Constellation (RPI))
反馈:
GitHub w3c/dxwg (拉取请求, 新建议题, 未解决议题)
public-dxwg-comments@w3.org 主题行为 [vocab-dcat-3] … 消息主题 … (归档)
勘误:
存在勘误
贡献者
Makx Dekkers

另请参阅 翻译

本文档还提供以下非规范性格式: TurtleRDF/XMLJSON-LD


摘要

DCAT 是一种 RDF 词汇表,旨在促进 Web 上发布的数据目录之间的互操作性。 本文档定义了该模式,并提供了其用法示例。

DCAT 使发布者能够使用标准模型和词汇表,在目录中描述数据集和数据服务, 从而促进来自多个目录的元数据的使用和聚合。 这可以提高数据集和数据服务的可发现性。 它还使采用去中心化方式发布数据目录成为可能,并使跨多个站点目录的数据集联合 搜索可以使用相同的查询机制和结构来实现。 聚合的 DCAT 元数据可以在数字保存过程中作为清单文件的一部分。

DCAT 术语的命名空间是 http://www.w3.org/ns/dcat#

DCAT 命名空间的建议前缀是 dcat

本文档状态

本节描述本文档在发布时的状态。 当前 W3C 出版物列表以及本技术报告的最新修订版可在 W3C 技术 报告索引中找到,地址为 https://www.w3.org/TR/。

本文档定义了 DCAT 2 词汇表([VOCAB-DCAT-2])的一次重大修订, 以回应在先前词汇表开发期间无法考虑的用例、需求和社区经验。 本次修订根据社区实践扩展了 DCAT 标准,同时支持 多样化的数据描述和数据集交换方法。DCAT 词汇表的主要变更包括:

这个新版本的词汇表更新并扩展了原版本,但保留了向后兼容性。 重大变更的完整列表(包含指向相关 GitHub 议题的链接)见 D. 变更历史

数据交换工作组已经考虑并讨论但因成熟度或共识不足而未解决的 议题、 需求和特性收集在 GitHub 中。那些被认为是未来版本优先事项的内容位于 DCAT Future Priority Work 里程碑中。

DCAT 历史

最初的 DCAT 词汇表由 Digital Enterprise Research Institute (DERI) 开发和托管,随后由 eGov Interest Group 加以完善,最后于 2014 年由 Government Linked Data (GLD) 工作组标准化 [VOCAB-DCAT-1]。

DCAT 的第二个推荐修订版 DCAT 2 [VOCAB-DCAT-2],由 Dataset Exchange Working Group 开发, 以回应一组新的用例和需求 [DCAT-UCR],这些用例和需求来自人们 自原始版本以来使用 DCAT 词汇表的经验,以及第一版中未考虑的新应用。

本版本 DCAT,即 DCAT 3,由 Dataset Exchange Working Group 开发,考虑了前一轮标准化中遗留未解决的用例和请求中 较为紧迫的一些。从 [VOCAB-DCAT-2] 开始的变更摘要见 D. 变更历史

外部术语

DCAT 纳入了来自既有词汇表的术语,其中可找到稳定且含义适当的术语, 例如 foaf:homepagedcterms:title。 为方便起见,外部定义术语的非正式摘要定义包含在 DCAT 词汇表中, 而权威定义则可在规范性引用中获得。 引用文献中定义的变更(如有)优先于本规范中给出的摘要。 注意,符合 DCAT(4. 一致性)仅涉及 DCAT 词汇表规范中术语的使用,因此 其他外部定义的可能变更不会影响 DCAT 实现的一致性。

请发送评论

工作组邀请发布者使用本文档所述 DCAT 的修订版本描述其目录和数据集,并按照 报告 DCAT 修订实现的说明报告其实现。此信息及后续分析发布在实现报告中。

本文档由 Dataset Exchange Working Group 作为 推荐标准发布,使用 推荐标准轨道

W3C 建议将本规范作为 Web 标准进行广泛部署。

W3C 推荐标准是一种规范,它在经过 广泛的共识构建后,由 W3C 及其成员认可,并且 工作组成员承诺为实现提供 免版税许可

本文档由一个根据 W3C 专利 政策运作的小组制作。 W3C 维护着一个 与该小组交付物相关的任何专利披露的公开列表; 该页面还包括 披露专利的说明。任何实际知悉某项专利且认为该专利包含 必要权利要求的个人, 必须按照 W3C 专利政策第 6 节披露该信息。

本文档受 2023 年 11 月 03 日 W3C 流程文档约束。

1. 引言

本节为非规范性内容。

在不同组织、研究人员、政府和公民之间共享数据资源,需要 提供元数据。 这与数据是否开放无关。 DCAT 是一种用于在 Web 上发布数据目录的词汇表,最初是在政府数据目录的背景下 开发的, 例如 data.govdata.gov.uk,但 它也适用于并已用于其他场景。

DCAT 3 扩展了先前版本,以支持更多用例和需求 [DCAT-UCR]。 这些包括除数据集之外还可编目其他资源的可能性, 例如数据集系列。此次修订还支持描述资源的版本控制。并提供了关于 如何使用逆属性的指导。

DCAT 提供 RDF 类和属性,以允许描述数据集和数据服务并将其纳入 目录。 使用标准模型和词汇表有助于使用和聚合来自 多个目录的元数据,这可以:

  1. 提高数据集和数据服务的可发现性
  2. 支持跨多个站点目录对数据集进行联合搜索

目录中描述的数据可以采用多种格式,从电子表格,到 XML 和 RDF,再到 各种专用格式。 DCAT 不对数据集的这些序列化格式作任何假设,但它确实 区分抽象数据集及其不同表现形式或分发。

数据通常通过某种服务提供,该服务支持选择现有数据的提取、子集或组合, 或选择由某些数据处理函数生成的新数据。 DCAT 允许在目录中包含对数据访问服务的描述。

互补词汇表可以与 DCAT 一起使用,以提供更详细的、特定于格式的 信息。 例如,如果某个数据集采用 RDF 格式,则来自 VoID 词汇表 [VOID] 的属性可 在 DCAT 中用于表达关于该数据集的各种统计信息。

本文档并不规定任何特定的 DCAT 数据目录部署方法。 DCAT 信息可以用多种形式呈现,包括可通过 SPARQL 端点访问的 RDF、作为 [HTML-RDFa] 嵌入到 HTML 页面中,或序列化为 RDF/XML [RDF-SYNTAX-GRAMMAR]、[N3]、 [Turtle]、[JSON-LD] 或其他格式。 在本文档中,示例使用 [Turtle],因为其可读性较好。

2. 变更动机

本节为非规范性内容。

2014 年 1 月发布的原始推荐标准 [VOCAB-DCAT-1] 提供了 描述数据集的基本框架。它在作为抽象概念的数据集和作为数据集表现形式的 分发之间作出了重要区分。尽管 DCAT 已被广泛 采用,但很明显,原始规范缺少若干基本特性,这些特性后来 要么通过配置文件机制添加,例如欧盟委员会的 DCAT-AP [DCAT-AP],要么通过 开发在不同程度上基于基础标准的更大词汇表来添加, 例如 Healthcare and Life Sciences Community Profile [HCLS-Dataset]、Data Tag Suite [DATS] 等。DCAT 2 [VOCAB-DCAT-2] 的开发旨在解决 不同社区经验中显现出的具体不足,其目标是 改善这些更大词汇表输出之间的互操作性。 例如,DCAT 2 提供了类、属性和指导,以处理标识符数据集质量 信息数据引用等问题。

本次修订,即 DCAT 3,对整个规范进行了更新。自 2014 年推荐标准 和 DCAT 2 以来的重要变更,在正文中用“注”小节标出,并在 D. 变更历史中说明。

3. 命名空间

DCAT 的命名空间为 http://www.w3.org/ns/dcat#。 DCAT 还大量使用其他词汇表中的术语,特别是 Dublin Core [DCTERMS]。 DCAT 自身定义了一组最小的类和属性。

3.1 规范性命名空间

本推荐标准规范性部分中使用的命名空间和前缀见下表。

前缀 命名空间 IRI 来源
adms http://www.w3.org/ns/adms# [VOCAB-ADMS]
dc http://purl.org/dc/elements/1.1/ [DCTERMS]
dcat http://www.w3.org/ns/dcat# [VOCAB-DCAT]
dcterms http://purl.org/dc/terms/ [DCTERMS]
dctype http://purl.org/dc/dcmitype/ [DCTERMS]
foaf http://xmlns.com/foaf/0.1/ [FOAF]
locn http://www.w3.org/ns/locn# [LOCN]
odrl http://www.w3.org/ns/odrl/2/ [ODRL-VOCAB]
owl http://www.w3.org/2002/07/owl# [OWL2-SYNTAX]
prov http://www.w3.org/ns/prov# [PROV-O]
rdf http://www.w3.org/1999/02/22-rdf-syntax-ns# [RDF-SYNTAX-GRAMMAR]
rdfs http://www.w3.org/2000/01/rdf-schema# [RDF-SCHEMA]
skos http://www.w3.org/2004/02/skos/core# [SKOS-REFERENCE]
spdx http://spdx.org/rdf/terms# [SPDX]
time http://www.w3.org/2006/time# [OWL-TIME]
vcard http://www.w3.org/2006/vcard/ns# [VCARD-RDF]
xsd http://www.w3.org/2001/XMLSchema# [XMLSCHEMA11-2]

3.2 非规范性命名空间

本节为非规范性内容。

本文档示例和指南中使用的、且并非来自本推荐标准规范性部分的命名空间和前缀 见下表。

前缀 命名空间 IRI 来源
dqv http://www.w3.org/ns/dqv# [VOCAB-DQV]
earl http://www.w3.org/ns/earl# [EARL10-Schema]
geosparql http://www.opengis.net/ont/geosparql# [GeoSPARQL]
oa http://www.w3.org/ns/oa# [ANNOTATION-VOCAB]
pav http://purl.org/pav/ [PAV]
sdmx-attribute http://purl.org/linked-data/sdmx/2009/attribute# [VOCAB-DATA-CUBE]
sdo https://schema.org/ [SCHEMA-ORG]
xhv http://www.w3.org/1999/xhtml/vocab# [XHTML-VOCAB]

4. 一致性

除标记为非规范性的章节外,本规范中的所有创作指南、图表、示例和注释 均为非规范性内容。本规范中的其他所有内容均为规范性内容。

本文档中的关键词 MAYMUSTMUST NOTSHOULD 应按 BCP 14 [RFC2119] [RFC8174] 中的说明解释,但仅当它们像此处所示以全大写形式出现时才如此。

如果满足以下条件,则数据目录符合 DCAT:

符合 DCAT 的目录MAY在目录的 RDF 描述中包含额外的非 DCAT 元数据字段和额外的 RDF 数据。

DCAT 配置文件是为数据目录制定的一种规范,它向 DCAT 添加额外约束。符合该配置文件的数据目录也符合 DCAT。配置文件中的额外约束 MAY 包括:

5. 词汇表概览

本节为非规范性内容。

5.1 DCAT 范围

DCAT 是一种用于表示数据目录的 RDF 词汇表。 DCAT 围绕七个主要类构建(1):

DCAT 类和属性的 UML 模型
1 DCAT 模型概览,显示可以作为 Catalog 成员的资源类及其 之间的关系。除非特别说明,DCAT 不提供 基数约束。

DCAT 中的数据集被定义为“由单个代理发布或策展的 数据集合,并以一种或多种序列化或格式供访问或下载”。 数据集是概念性实体,可以由一个或多个用于传输而序列化该数据集的 分发来表示。 数据集的分发可以通过数据服务提供。

数据服务通常提供对数据集的选择、提取、组合、处理或转换 操作,这些数据集可能托管在本地,也可能远离该服务。 对数据服务的任何请求的结果,都是数据集或 目录的部分或全部表示。 数据服务可能绑定到特定数据集,或者其源数据可能在请求时或 运行时配置。 数据分发服务允许选择和下载数据集或子集的分发。 数据发现服务允许客户端找到合适的数据集。 其他类型的数据服务包括数据转换服务,例如坐标转换 服务、重采样和插值服务,以及各种数据处理服务,包括 仿真和建模服务。 注意,DCAT 中的数据服务是一组提供数据访问的操作或 API。 通常会提供交互式用户界面,以便方便地访问 API 操作,但其描述不在 DCAT 范围内。 特定数据服务端点的细节通常会通过符合标准服务类型的描述来 指定,该描述补充 DCAT 词汇表本身的范围。

数据集和数据服务的描述可以包含在目录中。 目录是一种数据集,其成员项是数据集和数据服务的描述。 也可以对其他类型的资源进行编目,但 DCAT 的范围目前限于数据集 和数据服务。 若要将目录范围扩展到数据集和数据服务之外,建议在 DCAT 配置文件或 其他 DCAT 应用中定义 dcat:Resource 的额外子类。 若要将服务描述的范围扩展到数据分发服务之外,建议在 DCAT 配置文件或其他 DCAT 应用中定义 dcat:DataService 的额外子类。

目录记录描述目录中的一个条目。请注意,虽然 dcat:Resource 表示数据集或服务本身,dcat:CatalogRecord 则是描述资源在目录中 注册情况的记录。dcat:CatalogRecord 的使用被视为可选。它用于 显式捕获目录中条目的出处信息。如果这不是必要的,那么 dcat:CatalogRecord 可以安全地忽略。

5.2 RDF 注意事项

DCAT 词汇表是一个 OWL2 本体 [OWL2-OVERVIEW], 使用 [RDF-SCHEMA] 形式化。 DCAT 中的每个类和属性都由一个 IRI [RFC3987] 表示。 本地定义的元素位于命名空间 http://www.w3.org/ns/dcat# 中。 元素也采自若干外部词汇表,特别是 [FOAF]、[DCTERMS] 和 [PROV-O]

RDF 允许资源拥有全局标识符(IRI),也允许资源为空白节点。 空白节点可用于表示未用 IRI 显式命名的资源。 它们可以出现在三元组的主语和宾语位置 [RDF11-PRIMER]。 例如,在许多实际的 DCAT 目录中,分发被表示为嵌套在 相关数据集描述内部的空白节点。 虽然空白节点可以为某些用例提供灵活性,但在 Linked Data 场景中,空白节点会限制 我们协作注释数据的能力。 空白节点资源不能成为链接目标,也不能被来自 新来源的新信息注释。 由于 Linked Data 方法最大的好处之一是“任何人都可以在任何地方说任何事情”, 使用空白节点会削弱我们可从广泛采用 RDF 模型中获得的一些优势。 即便在单一应用数据集的封闭世界中,使用空白节点在集成新数据时也会很快 变得受限 [LinkedDataPatterns]。 因此,建议 DCAT 主要类的实例具有全局标识符, 并且在以 RDF 编码 DCAT 时通常不鼓励使用空白节点。

本文档中的所有 RDF 示例均以 Turtle 语法编写 [Turtle],并且许多示例 可从 DXWG 代码 仓库获得。

5.3 基本示例

本示例快速概述了 DCAT 可如何用于表示政府目录及其 数据集。标题、标签和关键词同时以英语和西班牙语提供,以演示 语言标签的使用。

首先是目录描述:

目录发布者具有相对 IRI ex:transparency-office。 可按 示例 2 中所示,提供发布者的进一步描述:

目录通过 dcat:dataset 属性列出其每个数据集。在 示例 1 中,使用相对 IRI ex:dataset-001 提到了一个 示例数据集。下面展示了使用 DCAT 对其可能的描述:

这里展示了该数据集的五种不同时间描述符。 数据集的发布日期和修订日期显示在 dcterms:issueddcterms:modified 中。 对于 dcterms:accrualPeriodicity 中的数据集更新频率,我们使用一个 来自作为 W3C Data Cube Vocabulary [VOCAB-DATA-CUBE] 工作组成部分开发的 面向内容的指南 中的实例。 时间覆盖范围或时间范围在 dcterms:temporal 中给出,它定义了一个 dcterms:PeriodOfTime,作为由 dcat:startDatedcat:endDate 表示的闭区间。 时间分辨率描述数据集中各项之间的最小间隔,它在 dcat:temporalResolution 中给出,并使用 标准数据类型 xsd:duration

此外,空间覆盖范围或空间范围使用来自 GeonamesIRI,在 dcterms:spatial 中给出。 空间分辨率描述数据集中各项之间的最小空间间隔,它在 dcat:spatialResolutionInMeters 中给出,并使用标准数据类型 xsd:decimal

提供了一个联系点,用于发送关于该数据集的评论和反馈。 可使用 vCard [VCARD-RDF] 提供 关于联系点的更多细节,例如电子邮件地址或电话号码。

数据集 ex:dataset-001-csv 的一种表示可以作为 5kB CSV 文件下载。 这被 表示为类型为 dcat:Distribution 的 RDF 资源。

5.4 按主题对数据集 分类

目录根据由相对 IRI ex:themes 表示的一组领域 对其数据集进行分类。SKOS [SKOS-REFERENCE] 可用于 描述所使用的领域:

请注意,该数据集被分类到由相对 IRI ex:accountability 表示的领域下。 建议将该概念定义为由 IRI ex:themes 标识的概念方案的一部分,该概念方案用于 描述目录领域。一个 SKOS 描述示例:

5.5 对数据集类型分类

数据集的类型或体裁可以使用 dcterms:type 属性指示。 建议该属性的值取自治理良好且广泛认可的 资源类型集合, 例如 DCMI Type Vocabulary [DCTERMS]、 MARC Genre/Terms Scheme、 [ISO-19115-1] MD_Scope codesDataCite resource types [DataCite], 或来自 Re3data 的 PARSE.Insight content-types [RE3DATA-SCHEMA]。

在下面的示例中,一个(概念性的)数据集使用来自不同 词汇表的值分别进行分类。

单个描述中也可以存在多个分类。

5.6 描述目录 记录元数据

如果目录发布者决定保留 描述其记录的元数据(即包含用于描述 数据集的元数据的记录),则可以使用 dcat:CatalogRecord。例如, 虽然 ex:dataset-001 发布于 2011-12-05,但它在 Imaginary Catalog 上的描述 添加于 2011-12-11。这可以按 示例 9 中所示用 DCAT 表示:

5.7 仅在某个网页 背后可用的数据集

ex:dataset-002 可作为 CSV 文件使用。不过,ex:dataset-002 只能 通过某个网页获得, 用户需要在该网页上跟随一些链接、提供一些信息并勾选一些复选框, 然后才能访问数据。

请注意 dcat:landingPage 的使用以及 dcat:Distribution 实例的定义。

5.8 一个 可下载且位于某个网页背后的数据集

另一方面,ex:dataset-003 可以通过某个登录页获得,也可以 从已知 URL 下载。

请注意,我们对可下载分发使用了 dcat:downloadURL,而通过登录页 可访问的其他分发 不必定义为单独的 dcat:Distribution 实例。

5.9 通过服务可用的 数据集

ex:dataset-004 以不同表示从不同服务分发。 每个 dcat:Distributiondcat:accessURL 与相应服务的 dcat:endpointURL 对应。 每个服务通过 dcterms:type 使用其通用类型来表征(此处使用来自 INSPIRE 空间数据服务类型词汇表的值), 通过 dcterms:conformsTo 使用其特定的 API 定义, 并通过 dcat:endpointDescription 链接各个端点参数和选项的详细描述。

6. 词汇表规范

6.1 RDF 表示

编辑注

(修订后的)DCAT 词汇表以 RDF 形式提供。 主要制品 dcat.ttl 是 核心 DCAT 词汇表的一种序列化。 与其一同提供的还有一组其他 RDF 文件,用于提供额外信息,包括:

  1. 文件 dcat-external.ttldcat-external.rdfdcat-external.jsonld 包含 DCAT 已为其提供额外文档或使用说明的外部定义术语。

  2. 文件 dcat2.ttldcat2.rdfdcat2.jsonld 对应于 DCAT 第 2 版 [VOCAB-DCAT-2]。

  3. 文件 dcat2014.ttldcat2014.rdf 对应于 DCAT 的 2014 年版本 [VOCAB-DCAT-1]。

6.2 来自其他 词汇表的元素

DCAT 需要使用若干其他词汇表中的元素。 此外,DCAT 可按照通常的 RDFS [RDF-SCHEMA] 和 OWL2 [OWL2-OVERVIEW] 规则和模式,由来自外部词汇表的额外元素进行扩充。

6.2.1 互补词汇表

来自若干互补词汇表的元素MAY与 DCAT 一起使用, 以提供更详细的信息。 例如:来自 VoID 词汇表 [VOID] 的属性允许在 由 DCAT 描述的数据集采用 RDF 格式时,描述关于该数据集的各种统计信息; 来自 Provenance ontology [PROV-O] 的属性可用于 提供关于生成数据集或服务的工作流以及相关活动和代理的更多信息; 来自 Organization Ontology [VOCAB-ORG] 的类和属性可用于说明责任代理的额外 细节。

6.2.2 元素定义

DCAT 命名空间之外术语的定义(包括域和值域)仅为方便起见在此提供, MUST NOT 被视为规范性内容。这些术语的 权威定义位于相应规范中,即 [DC11]、[DCTERMS]、[FOAF]、[PROV-O]、[RDF-SCHEMA]、[SKOS-REFERENCE]、 [XMLSCHEMA11-2] 和 [VCARD-RDF]。

6.3 类:Catalog

以下属性专用于此类:

超类 dcat:Dataset 的以下属性 也可使用:

超类 dcat:Resource 的以下属性 也可使用:

RDF 类: dcat:Catalog
定义: 关于资源的经策展元数据集合。
子类属于: dcat:Dataset
使用说明: 基于 Web 的数据目录通常表示为此类的单个实例。
使用说明: 在数据目录的上下文中,数据集和数据服务是资源的示例。
另请参见: 6.5 类:Catalog Record6.6 类: Dataset

6.3.1 属性:主页

RDF 属性: foaf:homepage
定义: 目录的主页(通常以 HTML 形式提供的公共 Web 文档)。
值域: foaf:Document
使用说明: foaf:homepage 是一种 逆函数属性(IFP),这意味着它MUST 唯一且精确地标识该资源的 Web 页面。此属性指示 规范 Web 页面,在关于该资源存在多个 Web 页面时可能很有帮助。

6.3.2 属性:主题

RDF 属性: dcat:themeTaxonomy
定义: 用于对目录中记录的资源(例如数据集和服务)进行分类的知识组织系统(KOS)。
域: dcat:Catalog
值域: rdfs:Resource
使用说明: 建议将该分类法组织为 skos:ConceptSchemeskos:Collectionowl:Ontology 或 类似形式,从而允许每个成员由一个 IRI 表示,并作为 Linked Data 发布。

6.3.3 属性:资源

RDF 属性: dcat:resource
定义: 列在目录中的资源。
子属性属于: dcterms:hasPart
域: dcat:Catalog
值域: dcat:Resource
使用说明: 这是表示目录成员关系的最通用谓词。当有更具体的 子属性可用时,建议使用更具体的子属性。
另请参见: dcat:resource 的子属性,特别是 dcat:datasetdcat:catalogdcat:service

6.3.4 属性:数据集

RDF 属性: dcat:dataset
定义: 列在目录中的数据集。
子属性属于: dcat:resource
域: dcat:Catalog
值域: dcat:Dataset

6.3.5 属性:服务

RDF 属性: dcat:service
定义: 列在目录中的服务。
子属性属于: dcat:resource
域: dcat:Catalog
值域: dcat:DataService

6.3.6 属性:目录

RDF 属性: dcat:catalog
定义: 列在目录中的目录。
子属性属于: dcat:resource
域: dcat:Catalog
值域: dcat:Catalog

6.3.7 属性:目录记录

RDF 属性: dcat:record
定义: 描述作为目录一部分的单个资源(例如数据集、数据 服务)注册情况的记录。
域: dcat:Catalog
值域: dcat:CatalogRecord

6.4 类:已编目资源

以下属性专用于此类:

RDF 类: dcat:Resource
定义: 由单个代理发布或策展的资源。
使用说明:

所有已编目资源的类,是 dcat:Datasetdcat:DataServicedcat:Catalog 以及 dcat:Catalog 的任何其他成员的超类。

此类承载所有已编目资源共有的属性,包括数据集和 数据服务。

此类的实例SHOULD包含在目录中。

在描述并非 dcat:Datasetdcat:DataService 的资源时,建议 创建 dcat:Resource 的合适子类, 或使用 dcat:Resource 并通过 dcterms:type 属性来指示 具体类型。

使用说明: dcat:Resource 是一个扩展点,它能够 定义任何类型的目录。对于其他类型资源的目录,可在 DCAT 配置文件或其他 DCAT 应用中定义额外子类。
另请参见: 6.5 类:Catalog Record

6.4.1 属性:访问权限

RDF 属性: dcterms:accessRights
定义: 关于谁可以访问该资源的信息,或其安全状态的指示。
值域: dcterms:RightsStatement
使用说明: 可以为资源提供关于许可证和权利的信息。另请参见 9. 许可证和权利声明中的指导。
另请参见: 6.4.20 属性:权利

6.4.2 属性:符合

RDF 属性: dcterms:conformsTo
定义: 所描述资源所符合的既定标准。
值域: dcterms:Standard(“用于 比较的基础;可据以评估其他事物的参照点。” [DCTERMS])
使用说明: 此属性SHOULD用于指示已编目资源内容所符合的模型、模式、 本体、视图或配置文件。

关于此属性的使用指导,参见 14.2.1 对标准的一致性

6.4.3 属性:联系点

RDF 属性: dcat:contactPoint
定义: 已编目资源的相关联系信息。建议使用 vCard [VCARD-RDF]。
值域: vcard:Kind

6.4.4 属性:创建者

RDF 属性: dcterms:creator
定义: 负责生成该资源的实体。
值域: foaf:Agent
使用说明: 建议将类型为 foaf:Agent 的资源作为此属性的值。
另请参见: 6.12 类:组织/人员

6.4.5 属性:描述

RDF 属性: dcterms:description
定义: 关于该资源的自由文本说明。
值域: rdfs:Literal

6.4.6 属性:标题

RDF 属性: dcterms:title
定义: 赋予该资源的名称。
值域: rdfs:Literal

6.4.7 属性:发布日期

RDF 属性: dcterms:issued
定义: 该资源正式发行(例如发布)的日期。
值域: rdfs:Literal 使用相关的符合 ISO 8601 日期和时间 的字符串 [DATETIME] 编码,并使用 适当的 XML Schema 数据类型 [XMLSCHEMA11-2] 进行类型化 (xsd:gYearxsd:gYearMonthxsd:datexsd:dateTime)。
使用说明: 此属性SHOULD使用最早已知的发行日期设置。
另请参见: 6.5.3 属性:列入日期6.8.3 属性:发布日期

6.4.8 属性: 更新/修改日期

RDF 属性: dcterms:modified
定义: 该资源被更改、更新或修改的最近日期。
值域: rdfs:Literal 使用相关的符合 ISO 8601 日期和时间 的字符串 [DATETIME] 编码,并使用 适当的 XML Schema 数据类型 [XMLSCHEMA11-2] 进行类型化 (xsd:gYearxsd:gYearMonthxsd:datexsd:dateTime)。
使用说明: 此属性的值表示实际资源的变更,而不是 目录记录的变更。缺失值MAY表示该 资源自初次发布后从未发生变更,或最后 修改日期未知,或该资源会持续更新。
另请参见: 6.6.2 属性:频率6.5.4 属性:更新/修改 日期6.8.4 属性:更新/修改日期

6.4.9 属性:语言

RDF 属性: dcterms:language
定义: 该资源的一种语言。这指已编目资源(即数据集或 服务)的文本元数据(即标题、描述等)所使用的自然语言, 或数据集分发的文本值所使用的自然语言
值域:

dcterms:LinguisticSystem

由美国国会图书馆定义的资源(ISO 639-1ISO 639-2SHOULD 被使用。

如果语言定义了 ISO 639-1 (两个字母)代码,则SHOULD使用其对应的 IRI;如果未定义 ISO 639-1 代码, 则SHOULD使用与 ISO 639-2 (三个字母)代码对应的 IRI

使用说明: 如果资源以多种语言提供,请重复此属性。
使用说明: 为目录成员(即数据集或服务)提供的值,如果与为目录提供的 值冲突,则会覆盖目录的值。
使用说明: 如果数据集的表示按每种语言分别提供,则为每种语言定义一个 dcat:Distribution 实例,并使用 dcterms:language 描述每个分发的特定 语言(即该数据集将具有多个 dcterms:language 值,而每个分发仅 有一个作为其 dcterms:language 属性值的语言)。在 多语言分发的情况下,分发将具有多个 dcterms:language 值。

6.4.10 属性:发布者

RDF 属性: dcterms:publisher
定义: 负责使该资源可用的实体。
使用说明: 建议将类型为 foaf:Agent 的资源作为此属性的值。
另请参见: 6.12 类:组织/人员

6.4.11 属性:标识符

RDF 属性: dcterms:identifier
定义: 所描述或编目的资源的唯一标识符。
值域: rdfs:Literal
使用说明: 该标识符可能被用作资源 IRI 的一部分,但仍然 显式表示它是有用的。
使用说明: 标识符是分配给资源的文本字符串,用于在特定上下文中提供 明确引用。

6.4.12 属性:主题/类别

RDF 属性: dcat:theme
类型: owl:ObjectProperty
定义: 资源的一个主要类别。一个资源可以有多个主题。
子属性属于: dcterms:subject
使用说明: 用于对资源进行分类的主题集合被组织为 skos:ConceptSchemeskos:Collectionowl:Ontology 或 类似形式,用于描述目录中的所有类别及其关系。
另请参见: 6.3.2 属性:主题

6.4.13 属性:类型/体裁

RDF 属性: dcterms:type
定义: 资源的性质或体裁。
子属性属于: dc:type
值域: rdfs:Class
使用说明: 该值SHOULD取自治理良好且广泛 认可的受控词汇表,例如:
  1. DCMI Type vocabulary [DCTERMS]
  2. [ISO-19115-1] scope codes
  3. Datacite resource types [DataCite]
  4. re3data.org 使用的 PARSE.Insight content-types [RE3DATA-SCHEMA] (参见第 15 项 contentType)
  5. MARC intellectual resource types
这些受控词汇表中的某些成员并不严格适用于数据集或 数据服务(例如 DCMI Type EventPhysicalObject;[ISO-19115-1] CollectionHardwareCollectionSessionInitiativeSampleRepository),但可用于 DCAT 配置文件或应用中定义的 其他类型目录的上下文。
使用说明: 若要描述资源的文件格式、物理介质或尺寸,请使用 dcterms:format 元素。

6.4.14 属性:关系

RDF 属性: dcterms:relation
定义: 与已编目资源具有未指定关系的资源。
使用说明: 在已编目资源与相关资源之间的关系性质未知时,dcterms:relation SHOULD 被使用。如果已知链接关系的性质,则SHOULD使用更具体的子属性。 dcat:distribution 属性SHOULD用于从 dcat:Dataset 链接到数据集的某种表示, 该表示描述为 dcat:Distribution
另请参见: dcterms:relation 的子属性,特别是 dcat:distributiondcterms:hasPart、 (及其子属性 dcat:resourcedcat:catalogdcat:datasetdcat:service )、 dcterms:isPartOfdcterms:conformsTodcterms:isFormatOfdcterms:hasFormatdcterms:isVersionOfdcterms:hasVersion(及其 子属性 dcat:hasVersion )、 dcterms:replacesdcterms:isReplacedBydcterms:referencesdcterms:isReferencedBydcterms:requiresdcterms:isRequiredBy

许多现有和旧式目录并不区分数据集组件、表示、 文档、模式以及其他被合并为数据集一部分的资源。 dcterms:relation 是若干更具体属性的超属性, 这些更具体属性表达更精确的关系,因此使用 dcterms:relation 与随后用更具体语义重新分类并不冲突, 不过如果可能,SHOULD使用更专门的子属性 将数据集链接到组件和补充资源。

6.4.15 属性:限定 关系

RDF 属性: dcat:qualifiedRelation
定义: 指向与另一个资源的关系描述的链接
子属性属于: prov:qualifiedInfluence
域: dcat:Resource
值域: dcat:Relationship
使用说明: 用于链接到另一个资源,其中关系的性质已知,但并不 匹配标准 [DCTERMS] 属性之一 (dcterms:hasPartdcterms:isPartOfdcterms:conformsTodcterms:isFormatOfdcterms:hasFormatdcterms:isVersionOfdcterms:hasVersiondcterms:replacesdcterms:isReplacedBydcterms:referencesdcterms:isReferencedBydcterms:requiresdcterms:isRequiredBy) 或 [PROV-O] 属性 (prov:wasDerivedFromprov:wasInfluencedByprov:wasQuotedFromprov:wasRevisionOfprov:hadPrimarySourceprov:alternateOfprov:specializationOf)。

此 DCAT 属性遵循 15. 限定关系中描述的通用限定关系模式。

6.4.16 属性:关键词/标签

RDF 属性: dcat:keyword
定义: 描述该资源的关键词或标签。
值域: rdfs:Literal

6.4.17 属性:登录页

RDF 属性: dcat:landingPage
定义: 可在 Web 浏览器中导航到的网页,用于获取对目录、 数据集、其分发和/或额外信息的访问。
子属性属于: foaf:page
值域: foaf:Document
使用说明: 如果分发只能通过登录页访问 (即直接下载 URL 未知),则登录页链接SHOULD在分发上重复作为 dcat:accessURL。 (参见 5.7 仅在某个网页背后可用的数据集

6.4.18 属性:限定 归属

RDF 属性: prov:qualifiedAttribution
定义: 指向对资源负有某种责任的 Agent 的链接
子属性属于: prov:qualifiedInfluence
域: prov:Entity
值域: prov:Attribution
使用说明: 用于链接到某个 Agent,其中关系性质已知,但并不 匹配标准 [DCTERMS] 属性之一 (dcterms:creatordcterms:publisher)。 在 prov:Attribution 上使用 dcat:hadRole,以捕获该 Agent 相对于该 Resource 的责任。 用法示例参见 15.1 数据集和代理之间的关系

此 DCAT 属性遵循 15. 限定关系中描述的通用限定关系模式。

6.4.19 属性:许可证

RDF 属性: dcterms:license
定义: 使该资源可用的法律文件。
值域: dcterms:LicenseDocument
使用说明: 可以为资源提供关于许可证和权利的信息。另请参见 9. 许可证和权利声明中的指导。
另请参见: 6.4.20 属性:权利6.8.5 属性:许可证

6.4.20 属性:权利

RDF 属性: dcterms:rights
定义: 涉及未由 dcterms:licensedcterms:accessRights 处理的所有权利的声明, 例如版权声明。
值域: dcterms:RightsStatement
使用说明: 可以为资源提供关于许可证和权利的信息。另请参见 9. 许可证和权利声明中的指导。
另请参见: 6.4.19 属性:许可证6.8.7 属性:权利6.4.1 属性:访问权限

6.4.21 属性:有部分

RDF 属性: dcterms:hasPart
定义: 在物理上或逻辑上包含于所描述 资源中的相关资源。

6.4.22 属性:有政策

RDF 属性: odrl:hasPolicy
定义: 表达与该资源相关权利的、符合 ODRL 的政策。
值域: odrl:Policy
使用说明: 可以为资源提供以 ODRL 政策 [ODRL-MODEL] 形式表达的权利信息, 该政策使用 ODRL 词汇表 [ODRL-VOCAB]。另请参见 9. 许可证和 权利声明中的指导。
另请参见: 6.4.19 属性:许可证6.4.1 属性:访问权限6.4.20 属性:权利

6.4.23 属性:被引用 者

RDF 属性: dcterms:isReferencedBy
定义: 引用、引述或以其他方式指向 已编目资源的相关资源,例如出版物。
使用说明: 就数据引用用例而言,当已编目资源是数据集时, dcterms:isReferencedBy 属性允许将数据集关联到 引用或指向该数据集的资源(例如学术出版物)。可以使用多个 dcterms:isReferencedBy 属性来指示该数据集已 被多个出版物或其他资源引用。
使用说明: 此属性用于将某个资源与所讨论的(类型为 dcat:Resource 的)资源相关联。对于此属性未涵盖的其他资源关系, 可以使用更通用的属性 dcat:qualifiedRelation。 另请参见 15. 限定关系

关于此属性的使用示例,参见 C.3 链接数据集和出版物

6.4.24 属性:上一 版本

RDF 属性: dcat:previousVersion
定义: 谱系中某个资源的上一版本 [PAV]。
等价属性: pav:previousVersion
子属性属于: prov:wasRevisionOf
使用说明:

此属性旨在用于指定由资源快照组成的版本链。

此属性所使用的版本概念,限于资源生命周期中发生修订所产生的 版本。这里的典型情况之一是表示某个数据集随时间 发布的各版本历史。

另请参见: 6.4.26 属性:当前版本6.4.25 属性:有版本6.4.7 属性:发布日期6.4.27 属性:取代6.4.30 属性:状态6.4.28 属性:版本6.4.29 属性:版本说明

关于此属性的使用指导,参见 11.1.1 版本链和层级结构

6.4.25 属性:有版本

RDF 属性: dcat:hasVersion
定义: 此资源具有一个更具体的、带版本的资源 [PAV]。
等价属性: pav:hasVersion
子属性属于: dcterms:hasVersion
子属性属于: prov:generalizationOf
使用说明:

此属性旨在将未带版本的或抽象的资源关联到 若干带版本的资源,例如快照 [PAV]。

此属性所使用的版本概念,限于资源生命周期中发生修订所产生的 版本。因此,其语义比其超属性 dcterms:hasVersion 更具体, 后者使用更宽泛的版本概念,包括版本和改编。

另请参见: 6.4.26 属性:当前版本6.4.24 属性:上一版本6.4.7 属性:发布日期6.4.27 属性:取代6.4.30 属性:状态6.4.28 属性:版本6.4.29 属性:版本说明

关于此属性的使用指导,参见 11.1.1 版本链和层级结构

6.4.26 属性:当前版本

RDF 属性: dcat:hasCurrentVersion
定义: 此资源具有一个内容等价的、更具体的带版本资源 [PAV]。
等价属性: pav:hasCurrentVersion
子属性属于: pav:hasVersion
使用说明:

此属性旨在将未带版本的或抽象的资源关联到一个 单一快照,该快照可用作永久链接以指示内容的当前版本 [PAV]。

此属性所使用的版本概念,限于资源生命周期中发生修订所产生的 版本。

另请参见: 6.4.25 属性:有版本6.4.24 属性:上一版本6.4.7 属性:发布日期6.4.27 属性:取代6.4.30 属性:状态6.4.28 属性:版本6.4.29 属性:版本说明

关于此属性的使用指导,参见 11.1.1 版本链和层级结构

6.4.27 属性:取代

RDF 属性: dcterms:replaces
定义: 被所描述资源替代、置换或取代的相关 资源 [DCTERMS]。
子属性属于: dcterms:relation
另请参见: 6.4.26 属性:当前版本6.4.25 属性:有版本7. 逆属性的使用6.4.24 属性:上一版本6.4.7 属性:发布日期6.4.30 属性:状态6.4.28 属性:版本6.4.29 属性:版本说明

关于此属性的使用指导,参见 11.1.2 被其他版本取代的版本

6.4.28 属性:版本

RDF 属性: dcat:version
定义: 资源的版本指示符(名称或标识符)。
等价属性: pav:version
值域: rdfs:Literal
使用说明:

DCAT 不规定应如何指定版本名称/标识符,并 参考 [DWBP] 的 最佳实践 7:提供 版本指示符作为指导。

另请参见: 6.4.26 属性:当前版本6.4.25 属性:有版本6.4.24 属性:上一版本6.4.7 属性:发布日期6.4.27 属性:取代6.4.30 属性:状态6.4.29 属性:版本说明

关于此属性的使用指导,参见 11.2 版本信息

6.4.29 属性:版本说明

RDF 属性: adms:versionNotes
定义: 此版本与资源上一版本之间变更的描述 [VOCAB-ADMS]。
值域: rdfs:Literal
使用说明:

如果与该资源上一版本存在向后兼容性问题, SHOULD使用此属性指定这些问题的 文本描述。

另请参见: 6.4.26 属性:当前版本6.4.25 属性:有版本6.4.24 属性:上一版本6.4.7 属性:发布日期6.4.27 属性:取代6.4.30 属性:状态6.4.28 属性:版本

关于此属性的使用指导,参见 11.2 版本信息

6.4.30 属性:状态

RDF 属性: adms:status
定义: 资源在特定工作流过程上下文中的状态 [VOCAB-ADMS]。
值域: skos:Concept
使用说明:

DCAT 不规定使用任何特定的生命周期状态集合,而是 参考适合相关应用场景的现有标准和社区实践。

另请参见: 6.4.26 属性:当前版本6.4.25 属性:有版本6.4.24 属性:上一版本6.4.7 属性:发布日期6.4.27 属性:取代6.4.28 属性:版本6.4.29 属性:版本说明

关于此属性的使用指导,参见 11.3 资源生命周期

6.4.31 属性:第一个

RDF 属性: dcat:first
定义: 当前资源所属的有序资源集合或系列中的 第一个资源。
子属性属于: xhv:first
使用说明:

在 DCAT 中,此属性用于属于 dcat:DatasetSeries 的资源。

另请参见: 6.4.32 属性:最后一个7. 逆属性的使用6.4.33 属性:上一个

关于此属性的使用指导,参见 12. 数据集系列

6.4.32 属性:最后一个

RDF 属性: dcat:last
定义: 当前资源所属的有序资源集合或系列中的 最后一个资源。
子属性属于: xhv:last
使用说明:

在 DCAT 中,此属性用于属于 dcat:DatasetSeries 的资源。

另请参见: 6.4.31 属性:第一个7. 逆属性的使用6.4.33 属性:上一个

关于此属性的使用指导,参见 12. 数据集系列

6.4.33 属性:上一个

RDF 属性: dcat:prev
定义: 有序资源集合或系列中位于当前资源之前的 上一个资源。
子属性属于: xhv:prev
使用说明:

在 DCAT 中,此属性用于属于 dcat:DatasetSeries 的资源。

需要注意,此属性不同于 dcat:previousVersion, 因为它并不表示同一资源的上一版本,而是表示在有序 资源集合中紧接当前资源之前的另一个 资源。

另请参见: 6.4.31 属性:第一个6.4.32 属性:最后一个7. 逆属性的使用

关于此属性的使用指导,参见 12. 数据集系列

6.5 类:目录记录

以下属性专用于此类(dcat:CatalogRecord):

RDF 类: dcat:CatalogRecord
定义: 目录中的一条记录,描述单个 dcat:Resource 的注册情况。
使用说明 此类是可选的,并非所有目录都会使用它。它存在于那些需要区分 关于数据集或服务的元数据与关于目录中有关该 数据集或服务的条目的元数据的目录中。例如, 数据集发布日期属性反映 发布机构最初使该信息可用的日期,而 目录记录的发布日期则是该数据集被添加到 目录中的日期。 在这两个日期不同,或只知道后者的情况下,发布日期 SHOULD 只为目录记录指定。 请注意,W3C PROV Ontology [PROV-O] 允许描述进一步的 出处信息,例如与数据集或其注册的某次特定变更相关的 过程细节和参与的代理。
另请参见 6.6 类:Dataset

如果目录表示为带有命名图的 RDF Dataset(如 [SPARQL11-QUERY] 中所定义), 那么适合将每个数据集的描述 (由所有提及 dcat:Datasetdcat:CatalogRecord 及其任何 dcat:Distribution 的 RDF 三元组组成) 放入单独的命名图中。该图的名称SHOULD是目录记录的 IRI

6.5.1 属性:标题

RDF 属性: dcterms:title
定义: 赋予该记录的名称。
值域: rdfs:Literal

6.5.2 属性:描述

RDF 属性: dcterms:description
定义: 关于该记录的自由文本说明。
值域: rdfs:Literal

6.5.3 属性:列入日期

RDF 属性: dcterms:issued
定义: 对应数据集或服务在目录中被列入(即正式记录)的日期。
值域: rdfs:Literal 使用相关的符合 ISO 8601 日期和时间 的字符串 [DATETIME] 编码,并使用 适当的 XML Schema 数据类型 [XMLSCHEMA11-2] 进行类型化 (xsd:gYearxsd:gYearMonthxsd:datexsd:dateTime)。
使用说明: 这表示数据集被列入目录的日期,而不是数据集本身的发布日期。
另请参见: 6.4.7 属性:发布日期

6.5.4 属性: 更新/修改日期

RDF 属性: dcterms:modified
定义: 目录条目被更改、更新或修改的最近日期。
值域: rdfs:Literal 使用相关的符合 ISO 8601 日期和时间 的字符串 [DATETIME] 编码,并使用 适当的 XML Schema 数据类型 [XMLSCHEMA11-2] 进行类型化 (xsd:gYearxsd:gYearMonthxsd:datexsd:dateTime)。
使用说明: 这表示目录条目的最后更改日期,即数据集的目录元数据 描述的最后更改日期,而不是数据集本身的日期。
另请参见: 6.4.8 属性:更新/修改日期

6.5.5 属性:主要主题

RDF 属性: foaf:primaryTopic
定义: 记录中描述的 dcat:Resource(数据集或服务)。
使用说明: foaf:primaryTopic 属性是函数性的: 每条目录记录最多可以有一个主要主题,即描述一个已编目 资源。

6.5.6 属性:符合

RDF 属性: dcterms:conformsTo
定义: 所描述资源所符合的既定标准。
值域: dcterms:Standard(用于 比较的基础;可据以评估其他事物的参照点。)
使用说明: 此属性SHOULD用于指示目录记录元数据所符合的模型、模式、 本体、视图或配置文件。

关于此属性的使用指导,参见 14.2.1 对标准的一致性

6.6 类:Dataset

以下属性专用于此类:

超类 dcat:Resource 的以下属性也可 使用:

关于许可证和权利的信息SHOULD在 Distribution 层级提供。 除了为该 Dataset 的 Distribution 提供的信息之外, 也MAY为 Dataset 提供关于许可证和权利的信息,但不能替代 为这些 Distribution 提供的信息。为 Dataset 提供与该 Dataset 的某个 Distribution 所提供信息不同的许可证或权利信息SHOULD避免, 因为这可能产生法律冲突。

RDF 类: dcat:Dataset
定义: 由单个代理发布或策展的数据集合,并且可以通过一种或多种表示形式访问或 下载。
子类属于: dcat:Resource
使用说明: 此类描述概念性数据集。可能有一种或多种表示形式可用, 它们具有不同的模式布局和格式或序列化。
使用说明: 此类描述由数据集提供者发布的实际数据集。在需要 区分实际数据集及其在目录中的条目时(因为 修改日期等元数据可能不同),可以将 dcat:CatalogRecord 类用于 后者。
使用说明: DCAT 中的数据集概念是宽泛且包容的,旨在容纳 来自所有社区的资源类型。数据有许多形式,包括数字、 文本、像素、图像、声音和其他多媒体,以及潜在的其他类型, 其中任何一种都可能被收集进数据集。

6.6.1 属性:分发

RDF 属性: dcat:distribution
定义: 数据集的一个可用分发。
子属性属于: dcterms:relation
域: dcat:Dataset
值域: dcat:Distribution

6.6.2 属性:频率

RDF 属性: dcterms:accrualPeriodicity
定义: 数据集发布的频率。
值域: dcterms:Frequency(某事物 重复发生的速率)
使用说明: dcterms:accrualPeriodicity 的值给出 整个数据集被更新的速率。 这可以由 dcat:temporalResolution 补充,用于给出时间序列中所采集数据点之间的时间间隔。

关于 dcterms:accrualPeriodicitydcat:temporalResolution 如何 结合使用的示例见 10.1 时间属性

6.6.3 属性:所在系列

RDF 属性: dcat:inSeries
定义: 该数据集所属的数据集系列。
值域: dcat:DatasetSeries
子属性属于: dcterms:isPartOf
另请参见: 7. 逆属性的 使用

关于此属性的使用指导,参见 12. 数据集系列

6.6.4 属性: 空间/地理覆盖范围

RDF 属性: dcterms:spatial
定义: 数据集覆盖的地理区域。
值域: dcterms:Location(空间 区域或命名地点)
使用说明: 数据集的空间覆盖范围可编码为 dcterms:Location 的实例,或 可使用指向描述某个位置的资源的 IRI 引用(链接)来指示。建议链接到维护良好的地名录中的条目,例如 Geonames

用于表达 dcterms:Location 细节的选项见 6.16 类:Location

6.6.5 属性:空间 分辨率

RDF 属性: dcat:spatialResolutionInMeters
定义: 数据集中可解析的最小空间间隔,以米为单位测量。
值域: rdfs:Literal 类型为 xsd:decimal
使用说明: 如果数据集是图像或网格,这应对应于各项之间的间距。对于 其他类型的空间数据集,此属性通常表示数据集中各项之间的最小 距离。

此属性的值域是一个表示米制长度的数字。 其意图是以单个数字提供对数据空间分辨率的摘要性 指示。 可使用 Data Quality Vocabulary [VOCAB-DQV] 提供关于空间精度、准确度、分辨率和其他 统计量各方面的更复杂描述。

关于数据类型的使用,请注意 [JSON-LD] 会将数字转换为 xsd:doublexsd:integer,而 正确生成 xsd:decimal 需要使用带有显式或强制数据类型的字符串。在 [Turtle] 中,看似细微的修改也会改变 值的数据类型:100.0xsd:decimal,而 1e2xsd:double

还请注意,不带小数部分的数字常量(例如 42)在 [Turtle] 或 [JSON-LD] 中, 会生成数据类型为 xsd:integer 的字面量。由于 [XMLSCHEMA11-2] 将 xsd:integer 定义为 xsd:decimal 的派生类型,因此 这些字面量在语义上可作为 dcat:spatialResolutionInMeters 的值有效。 然而,诸如 [SHACL] 或 [ShEx] 之类的语法验证工具会将它们视为不同的 数据类型。因此,这些语言中的验证模式作者应考虑将 xsd:integer 添加到 dcat:spatialResolutionInMeters 的 可接受数据类型中。

6.6.6 属性:时间 覆盖范围

RDF 属性: dcterms:temporal
定义: 数据集所覆盖的时间段。
值域: dcterms:PeriodOfTime (由开始和结束日期命名或定义的时间间隔)
使用说明: 数据集的时间覆盖范围可编码为 dcterms:PeriodOfTime 的实例, 或可使用指向描述时间段或时间间隔资源的 IRI 引用(链接)来指示。

用于表达 dcterms:PeriodOfTime 细节的选项见 6.15 类:时间段

6.6.7 属性:时间 分辨率

RDF 属性: dcat:temporalResolution
定义: 数据集中可解析的最小时间段。
值域: rdfs:Literal 类型为 xsd:duration
使用说明: 如果数据集是时间序列,这应对应于序列中各项之间的间距。 对于其他类型的数据集,此属性通常表示数据集中各项之间的最小 时间差。

其意图是以单个值提供对数据分发时间分辨率的摘要性指示。 可使用 Data Quality Vocabulary [VOCAB-DQV] 提供关于时间精度、准确度、分辨率和其他 统计量各方面的更复杂描述。

dcat:temporalResolutiondcterms:accrualPeriodicity 之间的区别由 10.1 时间 属性中的示例说明。

6.6.8 属性:由……生成

RDF 属性: prov:wasGeneratedBy
定义: 生成数据集或为数据集创建提供业务上下文的活动。
域: prov:Entity
值域: prov:Activity。 活动是在一段时间内发生并作用于实体或与实体一起作用的事物; 它可以包括消费、处理、转换、修改、迁移、使用或 生成实体。
使用说明: 与数据集生成相关的活动通常是倡议、 项目、任务、调查、持续性活动(“照常业务”)等。可以使用多个 prov:wasGeneratedBy 属性来指示不同粒度级别的数据集 生产上下文。
使用说明: 使用 prov:qualifiedGeneration 来附加关于数据集与该活动之间关系的额外细节, 例如数据集在项目生命周期内被生成的确切时间

关于如何描述生成数据集的活动(例如项目、倡议、 持续性活动、任务或调查)的细节,不在本文档范围内。 prov:Activity 提供了一些 基本属性,例如开始和结束时间、相关代理等。 可通过应用中定义的类提供进一步细节。 有许多用于描述项目的本体可用,例如 用于学术研究项目的 VIVO [VIVO-ISF]、 用于软件项目的 DOAP (Description of a Project) [DOAP]、 以及 用于一般项目的 DBPedia [DBPEDIA-ONT],它们预计 适合不同应用。

6.7 类:Dataset Series

超类 dcat:Resourcedcat:Dataset 的以下属性也可使用:

RDF 类: dcat:DatasetSeries
定义: 一组分别发布但共享某些特征从而被归为一组的 数据集集合。
子类属于: dcat:Dataset
使用说明: 数据集系列也可以通过属性 dcterms:type 进行软类型化,如 [GeoDCAT-AP] 中使用的方法,并被 [DCAT-AP-IT] 和 [GeoDCAT-AP-IT] 采用)。
使用说明: 数据集系列的常见场景包括:由周期性发布的子集组成的时间 序列;由相同类型或主题但空间覆盖范围不同的项组成的 地图系列。

关于此属性的使用指导,参见 12. 数据集系列

6.8 类:Distribution

以下属性专用于此类:

RDF 类: dcat:Distribution
定义: 数据集的一种特定表示。数据集可能以多个 序列化形式提供,这些形式可能在多种方面不同,包括自然语言、媒体类型或 格式、模式组织、时间和空间分辨率、详细程度或配置文件 (配置文件可能指定上述任意或所有内容)。
使用说明: 这表示数据集的一般可用性。它不隐含关于 数据实际访问方法的信息,即是通过直接下载、API,还是通过 Web 页面。 使用 dcat:downloadURL 属性表示可直接下载的分发。
另请参见: 6.9 类:Data Service

dcat:Distribution 与服务或可访问它的 Web 地址之间的链接 使用 dcat:accessURLdcat:accessServicedcat:downloadURL 表达,如 1 所示,并在以下定义中描述。

6.8.1 属性:标题

RDF 属性: dcterms:title
定义: 赋予该分发的名称。
值域: rdfs:Literal

6.8.2 属性:描述

RDF 属性: dcterms:description
定义: 关于该分发的自由文本说明。
值域: rdfs:Literal

6.8.3 属性:发布日期

RDF 属性: dcterms:issued
定义: 分发正式发行(例如发布)的日期。
值域: rdfs:Literal 使用相关的符合 ISO 8601 日期和时间 的字符串 [DATETIME] 编码,并使用 适当的 XML Schema 数据类型 [XMLSCHEMA11-2] 进行类型化 (xsd:gYearxsd:gYearMonthxsd:datexsd:dateTime)。
使用说明: 此属性SHOULD使用最早已知的发行日期设置。
另请参见: 6.4.7 属性:发布日期

6.8.4 属性: 更新/修改日期

RDF 属性: dcterms:modified
定义: 分发被更改、更新或修改的最近日期。
值域: rdfs:Literal 使用相关的符合 ISO 8601 日期和时间 的字符串 [DATETIME] 编码,并使用 适当的 XML Schema 数据类型 [XMLSCHEMA11-2] 进行类型化 (xsd:gYearxsd:gYearMonthxsd:datexsd:dateTime)。
另请参见: 6.4.8 属性:更新/修改日期

6.8.5 属性:许可证

RDF 属性: dcterms:license
定义: 使该分发可用的法律文件。
值域: dcterms:LicenseDocument
使用说明: 关于许可证和权利的信息SHOULD在 Distribution 层级提供。除了为该 Dataset 的 Distribution 提供的信息之外, 也MAY为 Dataset 提供关于许可证和权利的信息,但不能替代 为这些 Distribution 提供的信息。为 Dataset 提供与该 Dataset 的某个 Distribution 所提供信息不同的许可证或权利信息SHOULD避免, 因为这可能产生法律冲突。另请参见 9. 许可证和权利声明中的指导。
另请参见: 6.8.7 属性:权利 6.4.19 属性:许可证

6.8.6 属性:访问权限

RDF 属性: dcterms:accessRights
定义: 涉及如何访问该分发的权利声明。
值域: dcterms:RightsStatement
使用说明: 可以为 Distribution 提供关于许可证和权利的信息。另请参见 9. 许可证和权利声明中的指导。
另请参见: 6.8.5 属性:许可证6.8.7 属性:权利6.4.1 属性:访问权限

6.8.7 属性:权利

RDF 属性: dcterms:rights
定义: 关于该分发中及其上的权利的信息。
值域: dcterms:RightsStatement
使用说明:

dcterms:licensedcterms:rights 的子属性, 可用于将分发链接到许可证文档。然而, dcterms:rights 允许链接到一个权利声明,该声明可包含 许可信息以及补充许可证的其他信息,例如 归属。

关于许可证和权利的信息SHOULD在 Distribution 层级提供。除了为该 Dataset 的 Distribution 提供的信息之外, 也MAY为 Dataset 提供关于许可证和权利的信息,但不能 替代为这些 Distribution 提供的信息。为 Dataset 提供与该 Dataset 的某个 Distribution 所提供信息不同的许可证或权利信息SHOULD避免, 因为这可能产生法律冲突。另请参见 9. 许可证和 权利声明中的指导。

另请参见: 6.8.5 属性:许可证6.4.20 属性:权利

6.8.8 属性:有政策

RDF 属性: odrl:hasPolicy
定义: 表达与该分发相关权利的、符合 ODRL 的政策。
值域: odrl:Policy
使用说明: 可以为分发提供以 ODRL 政策 [ODRL-MODEL] 形式表达的权利信息, 该政策使用 ODRL 词汇表 [ODRL-VOCAB]。另请参见 9. 许可证和 权利声明中的指导。
另请参见: 6.4.19 属性:许可证6.8.6 属性:访问权限6.8.7 属性:权利

6.8.9 属性:访问 URL

RDF 属性: dcat:accessURL
定义: 提供对数据集某个分发的访问的资源 URL。例如,登录 页、订阅源、SPARQL 端点。
域: dcat:Distribution
值域: rdfs:Resource
使用说明:

dcat:accessURL SHOULD 用于某个服务或位置的 URL,该服务或位置 可提供对该分发的访问,通常通过 Web 表单、查询或 API 调用。

对于可下载资源的直接链接,首选 dcat:downloadURL

如果分发只能通过登录页访问(即直接 下载 URL 未知),则与 dcat:Dataset 相关联的登录页 URL SHOULD 作为访问 URL 在某个分发上重复(参见 5.7 仅在某个网页背后可用的数据集)。

另请参见 6.8.11 属性:下载 URL6.8.10 属性:访问服务

dcat:accessURL 匹配属性链 dcat:accessService/dcat:endpointURL。在 DCAT 的 RDF 表示中, 这被公理化为 OWL 属性链公理。

6.8.10 属性:访问服务

RDF 属性: dcat:accessService
定义: 提供对数据集分发访问的数据服务
值域: dcat:DataService
使用说明: dcat:accessService SHOULD 用于链接到可提供对此分发访问的 dcat:DataService 的描述。
另请参见 6.8.11 属性:下载 URL6.8.9 属性:访问 URL

6.8.11 属性:下载 URL

RDF 属性: dcat:downloadURL
定义: 给定格式中可下载文件的 URL。例如 CSV 文件或 RDF 文件。 格式由该分发的 dcterms:format 和/或 dcat:mediaType 指示
域: dcat:Distribution
值域: rdfs:Resource
使用说明: dcat:downloadURL SHOULD 用于此分发可直接 获取的 URL,通常通过 HTTP GET 请求。
另请参见 6.8.9 属性:访问 URL6.8.10 属性:访问服务

6.8.12 属性:字节大小

RDF 属性: dcat:byteSize
定义: 分发的大小,以字节为单位。
域: dcat:Distribution
值域: rdfs:Literal 通常类型化为 xsd:nonNegativeInteger
使用说明: 当精确大小未知时,字节大小可以估算(为非负整数)。
使用说明: 虽然建议将大小给定为整数,但有时也会使用 诸如“1.5 MB”之类的替代字面量。

6.8.13 属性:空间 分辨率

RDF 属性: dcat:spatialResolutionInMeters
定义: 数据集分发中可解析的最小空间间隔,以米为单位测量。
值域: xsd:decimalxsd:double
使用说明: 如果数据集是图像或网格,这应对应于各项之间的间距。对于 其他类型的空间数据集,此属性通常表示数据集中各项之间的最小 距离。
使用说明: 替代空间分辨率可以作为不同的数据集分发提供

此属性的值域是一个表示米制长度的数字。 其意图是以单个数字提供对数据分发空间分辨率的摘要性 指示。 可使用 Data Quality Vocabulary [VOCAB-DQV] 提供关于空间精度、准确度、分辨率和其他 统计量各方面的更复杂描述。

6.8.14 属性:时间 分辨率

RDF 属性: dcat:temporalResolution
定义: 数据集分发中可解析的最小时间段。
值域: xsd:duration
使用说明: 如果数据集是时间序列,这应对应于序列中各项之间的间距。 对于其他类型的数据集,此属性通常表示数据集中各项之间的最小 时间差。
使用说明: 替代时间分辨率可以在不同的数据集分发中提供

其意图是以单个值提供对数据分发时间分辨率的摘要性指示。 可使用 Data Quality Vocabulary [VOCAB-DQV] 提供关于时间精度、准确度、分辨率和其他 统计量各方面的更复杂描述。

6.8.15 属性:符合

RDF 属性: dcterms:conformsTo
定义: 该分发所符合的既定标准。
值域: dcterms:Standard(用于 比较的基础;可据以评估其他事物的参照点。)
使用说明: 此属性SHOULD用于指示数据集的此表示所符合的模型、模式、 本体、视图或配置文件。这通常是对媒体类型或格式的 补充性关注点。
另请参见: 6.8.17 属性:格式6.8.16 属性:媒体类型

关于此属性的使用指导,参见 14.2.1 对标准的一致性

6.8.16 属性:媒体类型

RDF 属性: dcat:mediaType
定义: 由 IANA [IANA-MEDIA-TYPES] 定义的分发媒体类型。
子属性属于: dcterms:format
域: dcat:Distribution
值域: dcterms:MediaType
使用说明: 当分发的媒体类型在 IANA [IANA-MEDIA-TYPES] 中定义时,此属性SHOULD被使用, 否则可以将 dcterms:format 与 不同的值一起使用。
另请参见: 6.8.17 属性:格式6.8.15 属性:符合

6.8.17 属性:格式

RDF 属性: dcterms:format
定义: 分发的文件格式。
值域: dcterms:MediaTypeOrExtent
使用说明: 如果分发的类型由 IANA [IANA-MEDIA-TYPES] 定义,则 dcat:mediaType SHOULD 被使用。
另请参见: 6.8.16 属性:媒体类型6.8.15 属性:符合

6.8.18 属性:压缩 格式

RDF 属性: dcat:compressFormat
定义: 分发的压缩格式,其中数据以 压缩形式包含,例如用于减小可下载文件的大小。
值域: dcterms:MediaType
使用说明: 当分发中的文件被压缩时使用此属性,例如在 ZIP 文件中。如果可用,格式SHOULD使用 IANA [IANA-MEDIA-TYPES] 定义的媒体类型来表达。
另请参见: 6.8.19 属性:打包格式

关于此属性的使用示例,参见 C.5 压缩和打包的分发

6.8.19 属性:打包 格式

RDF 属性: dcat:packageFormat
定义: 分发的包格式,其中一个或多个数据文件被组合 在一起,例如用于使一组相关文件能够一起下载。
值域: dcterms:MediaType
使用说明: 当分发中的文件被打包时使用此属性,例如在 TAR 文件ZIP 文件Frictionless Data PackageBagit 文件中。如果可用,格式SHOULD使用 IANA [IANA-MEDIA-TYPES] 定义的媒体类型来表达。
另请参见: 6.8.18 属性:压缩格式

关于此属性的使用示例,参见 C.5 压缩和打包的分发

6.8.20 属性:校验和

RDF 属性: spdx:checksum
定义: 校验和属性提供一种机制,可用于验证文件或包的内容 未发生更改 [SPDX]。
值域: spdx:Checksum
使用说明:

校验和与下载 URL 相关。

6.9 类:Data Service

以下属性专用于此类: 端点描述端点 URL服务数据集

超类 dcat:Resource 的以下属性也可 使用:

RDF 类: dcat:DataService
定义: 一组操作,提供对一个或多个数据集或数据处理 函数的访问。
子类属于: dcat:Resource
子类属于: dctype:Service
使用说明: 如果 dcat:DataService 绑定到一个或多个 指定的数据集,则它们由 dcat:servesDataset 属性指示。
使用说明: 服务的种类可以使用 dcterms:type 属性指示。其值 可以取自受控词汇表,例如 INSPIRE 空间数据服务类型代码 列表 [INSPIRE-SDST]。

关于此类及相关属性的使用示例,参见 C.4 数据服务

6.9.1 属性:端点 URL

RDF 属性: dcat:endpointURL
定义: 服务的根位置或主要端点(可由 Web 解析的 IRI)。
域: dcat:DataService
值域: rdfs:Resource

6.9.2 属性:端点 描述

RDF 属性: dcat:endpointDescription
定义: 通过端点可用的服务的描述,包括其操作、 参数等。
域: dcat:DataService
值域: rdfs:Resource
使用说明: 端点描述给出实际端点实例的具体细节,而 dcterms:conformsTo 用于 指示这些端点实现的一般标准或规范。
使用说明: 端点描述可以用机器可读形式表达,例如 OpenAPI (Swagger) 描述 [OpenAPI]、OGC GetCapabilities 响应 [WFS]、[ISO-19142]、 [WMS]、[ISO-19128]、 SPARQL Service Description [SPARQL11-SERVICE-DESCRIPTION]、 [OpenSearch] 或 [WSDL20] 文档、Hydra API 描述 [HYDRA],否则在无法使用正式表示时, 可用文本或其他非正式方式表达。

6.9.3 属性:服务数据集

RDF 属性: dcat:servesDataset
定义: 此数据服务可以分发的数据集合。
值域: dcat:Dataset

6.10 类:Concept Scheme

RDF 类: skos:ConceptScheme
定义: 一种知识组织系统(KOS),用于表示目录中数据集的主题/类别。
另请参见: 6.3.2 属性: 主题6.4.12 属性:主题/类别

6.11 类:Concept

RDF 类: skos:Concept
定义: 用于描述目录中数据集的类别或主题。
使用说明: 建议对每个用于对数据集分类的 skos:Concept 使用 skos:inSchemeskos:topConceptOf, 以将其链接到它所属的概念方案。该概念方案通常使用 dcat:themeTaxonomy 与目录关联。
另请参见: 6.3.2 属性: 主题6.4.12 属性:主题/类别

6.12 类:Organization/Person

RDF 类:

foaf:Person(用于人员)

foaf:Organization(用于 政府机构或其他实体)

子类属于: foaf:Agent
使用说明: [FOAF] 提供了若干属性来描述这些实体。

6.13 类:Relationship

以下属性专用于此类: 关系具有角色

说明此类及其属性用法的示例见 15. 限定关系

RDF 类: dcat:Relationship
定义: 用于向 DCAT 资源之间的关系附加额外信息的关联类
子类属于: prov:EntityInfluence
使用说明: 用于表征数据集以及潜在其他资源之间的关系,在这种情况下 关系的性质已知,但无法由标准 [DCTERMS] 属性充分表征 (dcterms:hasPartdcterms:isPartOfdcterms:conformsTodcterms:isFormatOfdcterms:hasFormatdcterms:isVersionOfdcterms:hasVersiondcterms:replacesdcterms:isReplacedBydcterms:referencesdcterms:isReferencedBydcterms:requiresdcterms:isRequiredBy) 或 [PROV-O] 属性 (prov:wasDerivedFromprov:wasInfluencedByprov:wasQuotedFromprov:wasRevisionOfprov:hadPrimarySourceprov:alternateOfprov:specializationOf

6.13.1 属性:关系

RDF 属性: dcterms:relation
定义: 与源资源相关的资源。
使用说明: dcat:Relationship 的上下文中,预期它指向另一个 dcat:Dataset 或其他已编目资源。

6.13.2 属性:具有角色

RDF 属性: dcat:hadRole
定义: 实体或代理相对于另一个实体或资源的功能。
域: prov:Attributiondcat:Relationship
值域: dcat:Role
使用说明: 可用于限定归属中,以指定 Agent 相对于 Entity 的角色。建议该值取自代理角色的受控词汇表, 例如 [ISO-19115] CI_RoleCode
使用说明: 可用于限定关系中,以指定 Entity 相对于 另一个 Entity 的角色。建议该值取自实体角色的 受控词汇表。

此 DCAT 属性补充 prov:hadRole,后者提供 实体或代理相对于活动的功能。

6.14 类:Role

说明此类用法的示例见 15. 限定关系

RDF 类: dcat:Role
定义: 角色是在资源归属或资源关系的上下文中, 资源或代理相对于另一个资源的功能。
子类属于: skos:Concept
使用说明: 用于限定归属中,以指定 Agent 相对于 Entity 的角色。 建议将这些值作为代理角色的受控词汇表进行管理,例如 [ISO-19115-1] CI_RoleCode
使用说明:

用于限定关系中,以指定 Entity 相对于另一个 Entity 的角色。 建议将这些值作为实体角色的受控词汇表进行管理,例如

此 DCAT 类补充 prov:Role, 后者提供实体或代理相对于活动的功能。

6.15 类:Period of Time

以下属性专用于此类: 开始日期结束日期开始结束

说明这些选项如何用于数据集时间覆盖范围的示例见 10.1 时间属性

RDF 类: dcterms:PeriodOfTime
定义: 由开始和结束来命名或定义的时间间隔。
使用说明: 该间隔的开始和结束SHOULD分别通过使用 属性 dcat:startDatetime:hasBeginning, 以及 dcat:endDatetime:hasEnd 给出。 该间隔也可以是开放的——即它可以只有开始或只有结束。

6.15.1 属性:开始日期

RDF 属性: dcat:startDate
定义: 时间段的开始。
域: dcterms:PeriodOfTime
值域: rdfs:Literal 使用相关的符合 ISO 8601 日期和时间 的字符串 [DATETIME] 编码,并使用 适当的 XML Schema 数据类型 [XMLSCHEMA11-2] 进行类型化 (xsd:gYearxsd:gYearMonthxsd:datexsd:dateTime)。

6.15.2 属性:结束日期

RDF 属性: dcat:endDate
定义: 时间段的结束。
域: dcterms:PeriodOfTime
值域: rdfs:Literal 使用相关的符合 ISO 8601 日期和时间 的字符串 [DATETIME] 编码,并使用 适当的 XML Schema 数据类型 [XMLSCHEMA11-2]

6.15.3 属性:开始

RDF 属性: time:hasBeginning
定义: 时间段或间隔的开始。
值域: time:Instant
使用说明: 使用属性 time:hasBeginning 意味着 dcterms:temporal 属性的值是 [OWL-TIME] 中 time:TemporalEntity 类的成员。在此上下文中,这可被 理解为意味着 dcterms:PeriodOfTime 等价于子类 time:ProperInterval

6.15.4 属性:结束

RDF 属性: time:hasEnd
定义: 时间段或间隔的结束。
值域: time:Instant
使用说明: 使用属性 time:hasEnd 意味着 dcterms:temporal 属性的值是 [OWL-TIME] 中 time:TemporalEntity 类的成员。在此上下文中,这可被 理解为意味着 dcterms:PeriodOfTime 等价于子类 time:ProperInterval

6.16 类:Location

以下属性专用于此类: 几何边界框质心

说明这些选项如何用于数据集空间覆盖范围的示例见 10.2 空间属性

RDF 类: dcterms:Location
定义: 空间区域或命名地点。
使用说明:
  • 对于扩展几何(即一组表示相关地理区域顶点的 坐标),SHOULD使用属性 locn:geometry [LOCN]。
  • 对于划定空间区域的地理边界框,SHOULD使用属性 dcat:bbox
  • 对于空间区域的地理中心或另一个特征点,SHOULD使用属性 dcat:centroid

6.16.1 属性:几何

RDF 属性: locn:geometry
定义: 将空间事物 [SDW-BP] 与 相应几何关联起来。
值域: locn:Geometry
使用说明: 此属性的值域(locn:Geometry)允许任意 类型的几何规范。例如,几何可以编码为字面量, 如 WKTgeosparql:wktLiteral [GeoSPARQL]), 或表示为一个类,如 geosparql:Geometry (或其任何子类)[GeoSPARQL]。

6.16.2 属性:边界框

RDF 属性: dcat:bbox
定义: 空间事物的地理边界框 [SDW-BP]。
值域: rdfs:Literal
使用说明: 此属性的值域(rdfs:Literal)有意保持通用, 目的是允许不同的几何字面量编码。例如,几何可以 编码为 WKT 字面量(geosparql:wktLiteral [GeoSPARQL])。

6.16.3 属性:质心

RDF 属性: dcat:centroid
定义: 空间事物的地理中心(质心)[SDW-BP]。
值域: rdfs:Literal
使用说明: 此属性的值域(rdfs:Literal)有意保持通用, 目的是允许不同的几何字面量编码。例如,几何可以 编码为 WKT 字面量(geosparql:wktLiteral [GeoSPARQL])。

6.17 类:Checksum

以下属性专用于此类: 算法校验和值

RDF 类: spdx:Checksum
定义: Checksum 是一个值,可用于检查文件内容的完整性。即使 文件内容发生很小变化,也会改变其校验和。此类允许 表示各种校验和与加密消息摘要算法的 结果 [SPDX]。
使用说明: Checksum 包括算法(spdx:algorithm)和值(spdx:checksumValue),它们 允许验证文件完整性,以确保传输或存储过程中没有发生 错误。

6.17.1 属性:算法

RDF 属性: spdx:algorithm
定义: 标识用于生成主语 Checksum 的算法 [SPDX]。
域: spdx:Checksum
值域:

spdx:ChecksumAlgorithm 的个体集合。

使用说明: [SPDX] 2.2 版为以下 算法定义了个体: MD2MD4MD5MD6SHA-1SHA-224SHA-256SHA-384SHA-512

6.17.2 属性:校验和值

RDF 属性: spdx:checksumValue
定义: checksumValue 属性提供使用特定算法生成的 小写十六进制编码摘要值 [SPDX]。
域: spdx:Checksum
值域: xsd:hexBinary

7. 逆属性的使用

6. 词汇表规范中描述的属性有意不包括逆属性,目的是确保 即使在不使用 OWL 推理的系统中也能实现互操作性。

然而,鉴于某些用例需要逆属性,DCAT 支持它们,但要求它们MAY仅能作为补充用于 6. 词汇表 规范中描述的属性,并且MUST NOT用于替代这些属性。

下表列出了 DCAT 支持的逆属性。

属性 逆属性
dcat:prev dcat:next
dcat:previousVersion dcat:nextVersion
dcat:distribution dcat:isDistributionOf
dcterms:hasPart dcterms:isPartOf
dcat:resource dcat:inCatalog
dcterms:replaces dcterms:isReplacedBy
dcterms:isReferencedBy dcterms:references
dcat:hasVersion dcat:isVersionOf
dcat:inSeries dcat:seriesMember
foaf:primaryTopic foaf:isPrimaryTopicOf
prov:wasGeneratedBy prov:generated

8. 可解引用标识符

本节为非规范性内容。

科学和数据提供者社区为出版物、作者和数据使用多种不同的标识符。 DCAT 主要依赖持久性 HTTP IRI,作为使标识符 可操作的一种有效方式。值得注意的是,相当多的标识符方案可以编码为可解引用的 HTTP IRI,其中一些还会返回 机器可读元数据(例如 DOI [ISO-26324] 和 ORCID)。 无论如何,数据提供者仍可能需要引用遗留标识符、非 HTTP 可解引用 标识符、本地铸造的标识符或第三方提供的标识符。在这些情况下,[DCTERMS] 和 [VOCAB-ADMS] 可以发挥作用。

属性 dcterms:identifier 显式指示 HTTP IRI 以及遗留标识符。在以下 示例中,dcterms:identifier 标识一个 数据集,但它同样可以用于任何类型的资源。

当资源没有 HTTP 可解引用 ID 时,可以使用代理可解引用 IRI。例如,在 示例 14中,dcat.example.org/proxyidid 的代理。

属性 adms:identifier [VOCAB-ADMS] 可以表达其他本地 铸造的标识符或外部标识符,例如用于创作作品的 DOI、ELIarΧiv, 以及用于作者、发布者等行为主体的 ORCIDVIAFISNI,只要这些标识符全局唯一且稳定。

示例 15使用 adms:schemaAgencydcterms:creator 来表示定义该标识符方案的权威机构(例如示例中的 DOI foundation),当权威机构没有关联的 IRI 时使用 adms:schemaAgencyCrossRefDataCite 显示指南 建议将 DOI 显示为形式为 https://doi.org/10.xxxx/xxxxx/ 的完整 URL 链接。

示例 15没有表示 使用该方案分配和维护标识符的责任机构(例如 Zenodo),因为命名注册者违背 DOI 的理念, 在 DOI 中子空间从注册它们的组织中抽象出来,其优点是当组织发生变化或 该子空间的责任移交给其他人时,DOI 不会改变。示例 15展示了数据集创建者的本地铸造标识符 (例如 https://dcat.example.org/PoelenJorritHID)及其对应的 ORCID 标识符 (例如 https://orcid.org/0000-0003-3138-4118)。

当 HTTP 可解引用 ID 返回该数据集的 RDF/OWL 描述时,可以考虑使用 owl:sameAs。例如:

当以媒体类型 text/turtle 解引用时, https://doi.org/10.5281/zenodo.1486279 返回数据集的 [SCHEMA-ORG] 描述, 这可能会动态丰富 https://dcat.example.org/id 提供的描述。

在 DCAT 中区分数据集的主要标识符和替代(或遗留)标识符的需求 已被提出。然而,这在很大程度上是特定于应用的,更适合在 DCAT 配置文件中处理,而不是强制规定一种通用方法。

根据应用上下文,可以采用诸如 “DCAT-AP: How to manage duplicates?” 之类的特定指南,用于区分权威数据集与 第三方目录采集的数据集。

8.1 指示常见 标识符类型

如果标识符不是 HTTP 可解引用的,为了互操作性,可以将常见标识符类型作为 RDF 数据类型 [RDF11-CONCEPTS] 或自定义 OWL 数据类型 [OWL2-SYNTAX] 提供,参见 示例 17中的 ex:type

如果使用了已注册的 IRI 类型(遵循 [RFC3986],§ 3.1 Scheme),则标识符方案是 IRI 的一部分;因此在“type”中指示单独的 标识符方案是冗余的。例如,DOI 在 info IRI 方案中注册为命名空间 [IANA-URI-SCHEMES](参见 DOI FAQ #11),因此根据 [RFC3986],它应编码为 示例 18中的形式。

否则,标识符方案的常见类型示例(arXiv 等)定义在 DataCite schema [DataCite] 和 FAIRsharing Registry 中。

9. 许可证和权利声明

本节为非规范性内容。

选择合适方式来表达资源访问和重用的条件可能很复杂。 实现者在决定哪些条件适用于所描述资源之前,应始终寻求法律建议。

本规范区分三种主要情形: 第一种是声明与显式声明为“许可证”的资源相关联; 第二种是声明与仅表示访问权限的资源相关联; 第三种涵盖所有其他情况——即不涉及许可条件和/或访问 权限的声明(例如版权声明)。

为处理这些场景,建议使用属性 dcterms:rights 及其 子属性 dcterms:licensedcterms:accessRights。更准确地说:

  1. 使用 dcterms:license 来引用许可证;

  2. 使用 dcterms:accessRights 来表达仅涉及访问权限的声明(例如数据是否可由任何人访问,还是 仅可由授权方访问);

  3. 对所有其他类型的权利声明——即不由 dcterms:licensedcterms:accessRights 覆盖的权利声明, 例如版权声明——使用 dcterms:rights

最后,在通过 ODRL 政策表达权利的特定情况下,建议使用 odrl:hasPolicy 属性作为 从已编目资源或分发的描述到 ODRL 政策的链接。

10. 时间和空间

本节为非规范性内容。

10.1 时间属性

可以使用 DCAT 描述资源的五种时间属性。

  1. 资源的发布时间使用 dcterms:issued 给出。 该值通常编码为 xsd:date
  2. 资源的修订或更新时间使用 dcterms:modified 给出。 该值通常编码为 xsd:date
  3. 资源的更新计划使用 dcterms:accrualPeriodicity 指示。 该值应取自受控词汇表,例如 Dublin Core Collection Description Frequency Vocabulary
  4. 数据集中各项的最小时间间隔使用 dcat:temporalResolution 给出。 该值编码为 xsd:duration。 更新计划和时间分辨率可以结合使用,以支持对不同类型 时间序列数据的描述,如下所示。
  5. 数据集的时间范围使用 dcterms:temporal 给出。 该值是一个 dcterms:PeriodOfTime。 在 6.15 类: Period of Time 中推荐了若干用于表达 dcterms:PeriodOfTime 细节的选项。 下面给出这些示例。

10.2 空间属性

可以使用 DCAT 描述数据集的两种空间属性。

  1. 数据集中各项的最小空间间隔使用 dcat:spatialResolutionInMeters 给出。 该值为十进制数。

    dcat:spatialResolutionInMeters 的使用示例见 示例 3

  2. 数据集的空间范围使用 dcterms:spatial 给出。 该值是一个 dcterms:Location。 在 6.16 类: Location 中推荐了若干用于表达 dcterms:Location 细节的选项。

    下面给出这些示例。

11. 版本化

本节为非规范性内容。

version 的概念常被用作通用术语,用于表示资源与其派生资源之间的某种 关系。示例包括但不限于修订、版本、改编和 翻译。

本节专门关注如何使用 DCAT 描述由修订产生的版本——即 因资源生命周期中的变更而产生的版本。

为此,DCAT 构建于现有词汇表之上,特别是 [PAV] 本体的版本化组件,以及 来自 [DCTERMS]、[OWL2-OVERVIEW] 和 [VOCAB-ADMS] 的相关术语。

需要注意的是,版本化可以应用于任何 DCAT 一等公民资源, 包括目录、目录记录、数据集、分发。

还请注意,以下小节中描述的 DCAT 方法旨在补充 已在特定类型资源中使用的方法(例如 [OWL2-OVERVIEW] 为本体提供了一组版本化属性),以及给定领域和社区中的方法。关于 DCAT 版本化方法与其他词汇表方法的比较,参见 11.4 互补的 版本化方法

11.1 版本之间的 关系

DCAT 支持以下类型的版本之间关系:

  1. 表示版本链和层级结构(版本历史)的关系。
  2. 表示某个版本是否被另一个版本替换/取代的关系。

11.1.1 版本链和 层级结构

DCAT 定义了用于描述版本历史的特定属性,并与相应的 [PAV] 属性保持一致:

属性 dcat:previousVersion 用于构建版本链,可从给定版本向后 导航到第一个版本。这反映了最典型的用例——即将目录中作为不同资源 发布的不同版本链接起来。

除此之外,属性 dcat:hasVersion 可用于通过将抽象资源链接到其 各版本来指定版本层级结构。

如果需要,可以通过特定属性进一步描述版本层级结构。更准确地说, 属性 dcat:hasCurrentVersion 将抽象资源链接到与内容当前版本 对应的快照,而属性 dcat:isVersionOfdcat:hasVersion 的逆属性) 则提供从某个版本到抽象资源的反向链接的可能性(关于此属性的使用,参见 7. 逆属性的使用)。

请注意,指定版本链和层级结构分别只需要 dcat:previousVersiondcat:hasVersion 两个属性。是否使用其他 属性取决于相关用例的需求。

以下示例重用 [DWBP] 中 § 8.6 Data Versioning 的示例,并对其进行修订,以展示如何使用 本节描述的属性,在公交车站数据集上指定版本链和层级结构。

11.1.2 被其他版本 取代的版本

另一类关系涉及某个给定版本是否替换/取代另一个版本。为此, DCAT 重用相关的 [DCTERMS] 属性,即 dcterms:replaces,以及其逆属性 dcterms:isReplacedBy,用于需要提供 反向链接的情况。

值得注意的是,这些属性本身并不表示版本链——也就是说,一个 版本不一定取代其直接前一版本。

以下示例重用 示例 33中对 MyCity 公交车站数据集的描述,以展示如何在 DCAT 中指定被取代的版本。

11.2 版本信息

除上一节所示的关系外,带版本的资源还可以关联额外信息, 例如描述其与原始资源的差异(版本“增量”)、版本标识符和发布日期。

为此,DCAT 使用以下属性:

以下示例重用 [DWBP] 的 Best Practice 7: Provide a version indicator 中的示例,以展示如何在 DCAT 中指定版本信息。

11.3 资源生命周期

资源的生命周期是一个与版本化正交的方面,并且有时与版本化严格相关。 资源沿其生命周期(从构想到创建和发布)的演变可能 导致新版本,尽管并不总是如此(例如,如果存在审批工作流, 且无需修订,则资源可能不会发生任何变更)。同样,新版本的创建 不一定导致状态变更(例如,当变更不重大,和/或 发生在仍处于开发中的资源上时)。此外,当某个资源因修订 (修正错误、添加新内容等)而被替换时,它可能会转移到不同的生命周期 状态(例如弃用或撤回)。

值得注意的是,资源相对于其生命周期的状态本身通常是一项重要 信息,无论从数据提供者还是数据消费者的角度看都是如此。对于 数据消费者而言,了解资源是否仍在开发中,以及是否已 弃用或撤回(并且在这些情况下是否有新版本可用)非常重要。另一方面, 对于数据提供者来说,用生命周期状态标记资源,是正确管理 数据管理工作流的基础。例如,资源在发布之前可能需要 稳定,并且可能被标记为已批准和/或已注册。最后,除了资源的实际状态, 另一项有用信息是资源何时转移到不同状态 (例如创建、审查、接受、发布的时间)。

与版本化一样,资源生命周期取决于社区实践、数据管理政策和 现有工作流。此外,不同资源类型(例如数据集与目录记录)可能具有 不同的生命周期状态。

为指定生命周期状态,DCAT 使用属性 adms:status [VOCAB-ADMS],以及 适当的 [DCTERMS] 时间相关属性 (dcterms:createddcterms:dateSubmitteddcterms:dateAccepteddcterms:dateCopyrighteddcterms:issueddcterms:modifieddcterms:valid)。然而,DCAT 不规定使用任何特定的生命周期 状态集合,而是参考适合相关应用场景的现有标准和社区实践。

11.4 互补的 版本化方法

DCAT 版本化方法可以与现有版本化实践共存——例如特定 社区、领域和资源类型中使用的实践。

作为示例,下表展示了 DCAT 版本化属性与最常用于指定 相似概念的词汇表之间的对应关系,即用于本体的 OWL、 [DCTERMS] 和 [PROV-O]。

DCAT、OWL、[DCTERMS] 和 [PROV-O] 中相似(但不等价)的版本化属性
DCAT OWL [DCTERMS] [PROV-O]
dcat:hasVersion dcterms:hasVersion prov:generalizationOf
dcat:isVersionOf dcterms:isVersionOf prov:specializationOf
dcat:hasCurrentVersion owl:versionIRI
dcat:previousVersion owl:priorVersion prov:wasRevisionOf
dcat:version owl:versionInfo

请注意,对应关系并不意味着等价。这些属性具有不同的范围和 语义,因此它们可以互补但不能相互替代。特别是,OWL 属性 旨在用于可类型化为 owl:Ontology 的资源,而 [DCTERMS] 属性使用非常宽泛的 version 概念(包括版本和改编)。另一方面,DCAT 版本化属性旨在用于 目录中的任何资源,并使用非常具体的 version 概念,如 11. 版本化的引言中所解释。最后,尽管 [PROV-O] 属性 prov:wasRevisionOf 在语义上类似于 dcat:previousVersion,但并未 明确用于构建版本链,而 prov:generalizationOfprov:specializationOf 在语义上分别比其子属性 dcat:hasVersiondcat:isVersionOf 更宽泛。

以下示例展示了如何互补地使用 DCAT 和 OWL 来版本化 [VOCAB-DCAT-2]。

12. 数据集系列

本节为非规范性内容。

“数据集系列”指以某种方式相互关联、但分别发布的数据。一个示例是 按年份和/或国家拆分的预算数据,而不是在单个数据集中提供。

数据集系列在 [ISO-19115] 中定义为共享共同特征的 数据集集合 […]。不过,其使用并不限于地理空间数据,尽管在 其他领域中它们可能有不同名称(例如时间序列、数据切片),并且定义得或多或少 严格(例如参见 [VOCAB-DATA-CUBE] 中“dataset slice”的概念)。

将数据集分组为系列的原因和标准很多,可能与例如 数据特征、发布过程以及其典型使用方式有关。例如,体量巨大的数据 (如地理空间数据)通过拆分为较小的数据集,更容易由数据提供者和 数据消费者处理。另一个示例是按年度发布的数据,通常会作为 单独的数据集发布,而不是把新数据追加到系列中的第一个数据集。

由于各领域之间没有共同规则和标准来决定何时应创建数据集系列以及 应如何组织它们,DCAT 不规定任何特定方法,而是参考指南以及 领域和社区实践。本节的目的仅限于提供关于如何在 DCAT 中 指定数据集系列的指导。

12.1 如何指定数据集系列

DCAT 通过铸造一个新类 dcat:DatasetSeries,使数据集系列成为数据目录中的一等公民; 该类定义为 dcat:Dataset 的子类。 数据集通过使用属性 dcat:inSeries 链接到数据集系列。 请注意,数据集系列也可以是层级化的,并且一个数据集系列可以是另一个 数据集系列的成员。

数据集系列可能随时间演化,并获得新的数据集。例如,关于年度 预算数据的数据集系列每年都会获得一个新的子数据集。在这种情况下,可能很重要的是 用关系链接这些年度发布,指定第一个、上一个、下一个和最新的发布。在这样的 场景中,DCAT 分别使用属性 dcat:firstdcat:prevdcat:last。关于 dcat:next, 参见 7. 逆属性的 使用

系列中的数据集当然可以进行版本化。在这种情况下,数据集可以使用 11.1.1 版本链和层级结构中所说明的方法链接到其 各版本,如 示例 39 所示。

12.2 数据集系列元数据

关于数据集系列的属性可以分为两组。

第一组是描述数据集系列本身的属性。例如,属性 dcterms:accrualPeriodicity 就属于这种情况, 其值应对应于添加新子数据集的频率。

第二组是通过上游继承反映子数据集元数据中所描述维度的属性——即 子数据集的属性值由其父项(数据集系列)继承。

通常,这意味着,对于每个相关属性,数据集系列取值为 子数据集中指定值的并集。例如:

最后,子数据集的某些注解属性也可能需要在数据集系列层级加以考虑。 特别是,涉及子数据集创建/发布/更新日期的属性可能会影响系列中 相应属性的值。对于这些属性,DCAT 推荐以下方法:

12.3 现有 DCAT 实现中的数据集系列

现有 DCAT 实现采用两种主要的替代方法来指定数据集系列:

  1. 数据集系列被类型化为 dcat:Dataset,而其子数据集被类型化为 dcat:Distribution
  2. 数据集系列及其子数据集都被类型化为 dcat:Dataset,二者 通常使用 [DCTERMS] 属性 dcterms:hasPart / dcterms:isPartOf 链接。

在这两种情况下,数据集系列有时会使用 [DCTERMS] 属性 dcterms:type 进行软类型化(例如,这是 [GeoDCAT-AP] 中使用的方法,并被 [DCAT-AP-IT] 和 [GeoDCAT-AP-IT] 采用)。

这些选项在形式上并不与 DCAT 不兼容,因此在升级到 DCAT 3 期间, 它们可以与 dcat:DatasetSeries 共存。

13. 数据引用

本节为非规范性内容。

数据集引用是已识别出的需求之一。 数据引用是一种以类似于提供书目引用的方式引用数据的实践,承认数据 是任何研究过程中的一等产出。数据引用提供多种好处,例如 支持对数据生产者进行适当归属和致谢,促进数据发现,支持跟踪数据的影响和 重用,允许数据协作和重用,并能够复现基于数据的结果。

为支持数据引用,数据集描述至少应包括:数据集标识符、数据集创建者、 数据集标题、数据集发布者以及数据集发布或发行日期。这些元素是 DataCite 元数据模式 [DataCite] 所要求的元素; 该元数据与 [DataCite] 分配给研究数据的持久标识符 (Digital Object Identifiers 或 DOI)相关联。

为支持数据引用,DCAT 2 增加了对 可解引用标识符的考虑,并支持指示 已编目资源的创建者。数据引用所需的其余属性 已在 DCAT 1 [VOCAB-DCAT-1] 中提供。

数据集描述中数据引用所需属性的可用性约束,可以表示为一个 DCAT 数据引用配置文件。

14. 质量信息

本节为非规范性内容。

Data Quality Vocabulary (DQV) [VOCAB-DQV] 为数据 质量的不同方面提供了通用建模模式。 它可以将 DCAT 数据集和分发与不同类型的质量信息关联起来,包括:

每种类型的质量信息可以关联到一个或多个质量维度,即与消费者相关的质量 特征。将质量视为多维空间的实践在质量管理领域已经成熟, 用于将质量管理拆分为可处理的部分。DQV 不定义规范性的质量 维度列表。它提供了 ISO/IEC 25012 [ISO-IEC-25012] 和 [ZaveriEtAl] 中提出的质量维度,作为两个可能的起点。它还为后者定义的质量维度和类别 提供了 RDF 表示。最终,实现者需要自行选择最适合其需求的 质量维度集合。 以下小节展示如何结合 DCAT 和 DQV 来描述数据集和 分发的质量。 关于全面介绍和更多使用示例,请参见 [VOCAB-DQV]。

14.1 提供质量信息

数据消费者(ex:consumer1)描述数据集 ex:genoaBusStopsDataset 的质量,该数据集包括热那亚的 地理参照公交站列表。他/她用关于数据完整性 (ldqd:completeness)的 DQV 质量说明 (ex:genoaBusStopsDatasetCompletenessNote)注解该数据集, 以警告该数据集只包含 30000 个站点中的 20500 个。

活动 ex:myQualityChecking 使用服务 ex:myQualityChecker 来检查 ex:genoaBusStopsDataset 数据集的质量。度量 ex:completenessWRTExpectedNumberOfEntities 被应用于测量数据集完整性(ldqd:completeness),并产生质量测量 ex:genoaBusStopsDatasetCompletenessMeasurement

[VOCAB-DQV] 中还提供了 其他质量文档示例,包括关于 如何表达数据集 准确度和精度的示例。

14.2 记录 对标准的一致性

本节展示了将 [VOCAB-DQV] 与 [PROV-O] 和 EARL [EARL10-Schema] 组合的 不同建模模式,用于表示对既定质量标准的一致程度以及 关于一致性测试的细节。

14.2.1 对某一标准的一致性

使用 dcterms:conformsTodcterms:Standard 是表示对标准一致性的 众所周知的模式。示例 43直接借自 [SDW-BP](示例 51),声明一个虚构的 dcat:Dataset 符合关于空间数据集和服务互操作性的欧盟 INSPIRE 法规("Commission Regulation (EU) No 1089/2010 of 23 November 2010 implementing Directive 2007/2/EC of the European Parliament and of the Council as regards interoperability of spatial data sets and services")。

另一个示例涉及指定数据集中使用的坐标参考系统(CRS)——这是通常包含在地理空间元数据中的信息。 示例 44 展示了如何在 DCAT 中指定数据集的 CRS

示例 44中, http://www.opengis.net/def/crs/EPSG/0/28992 是来自 OGC CRS Registry 的一个 IRI,对应于 EPSG:28992("Amersfoort / RD New")(另见 示例 30)。

为确保互操作性,重要的是一致使用标识参考标准/规范的 IRI。特别是,DCAT 推荐以下通用规则:

  • 可用时,使用来自参考注册表的 IRI。 示例包括 W3C TR registryOGC Definitions ServerISO OBP
  • 使用标准/规范的 IRI, 而不是命名空间 IRI。例如,为表达 dcat:CatalogRecord 与 DCAT 的一致性,应使用的 IRIhttps://www.w3.org/TR/vocab-dcat/,而不是 http://www.w3.org/ns/dcat#
  • 使用规范的、持久的 IRI。 这通常在文档本身中指定。如果有疑问,请使用该标准/规范的 书目引用中包含的那个。
  • 使用不带版本的 IRI。如果你 需要表达对标准/规范特定版本的一致性,请同时使用不带版本和带版本的 IRI。例如,如果需要 显式声明某个 dcat:CatalogRecord 与 DCAT 2 一致,请同时使用 https://www.w3.org/TR/vocab-dcat/https://www.w3.org/TR/vocab-dcat-2/

示例 45扩展了 示例 9,以展示如何按照上述规则指定某个 给定目录记录与 DCAT 一致。

14.2.2 一致程度

某些法律上下文要求指定一致程度。例如,INSPIRE 元数据 采用一个特定受控词汇表 [INSPIRE-DoC], 用于在完全符合之外表达不符合和未评估。类似的受控 词汇表也可以在其他上下文中定义。

示例 47 指定一些新铸造的 概念,用于表示一致程度(即符合、不符合),并声明 dcterms:type 用于指示 一致性测试的结果。按照 [GeoDCAT-AP] 中使用的模式,该示例使用 prov:Entity 对一致性测试建模(例如 ex:testResult),使用 prov:Activity 对测试活动建模(例如 ex:testingActivity),并使用一个派生自 Data on the Web Best Practices [DWBP] 的 prov:Plan (例如 ex:conformanceTest)来检查整套最佳实践。限定的 PROV 关联将测试活动绑定到一致性测试。

此外,也可以部署 [VOCAB-DQV] 来 测量对特定标准的符合情况。在 示例 48中, ex:levelOfComplianceToDWBP 是一种质量度量,用于以通过的一致性测试百分比 来测量某个数据集对 [DWBP] 的符合情况。示例 48 假定 iso 是表示 ISO/IEC 25012 [ISO-IEC-25012] 中定义的质量 维度和类别的命名空间前缀。

质量测量 ex:measurement_complianceToDWBP 表示数据集 ex:Dataset 的符合水平,即对度量 ex:levelOfComplianceToDWBP 的测量。如果只有一部分一致性测试成功(例如一半 一致性测试),该测量将如 示例 49 所示。

14.2.3 一致性测试结果

可以使用 EARL [EARL10-Schema] 提供关于测试的更多信息。EARL 提供用于描述测试活动的特定类,可以与 [PROV-O] 结合采用。 示例 50 将 测试活动 ex:testingActivity 描述为 earl:Assertion, 而不是 prov:Activity 上的限定关联。 earl:Assertion 声明 数据集 ex:Dataset 已使用一致性测试 ex:conformanceTest 进行测试,并且 如 ex:testResult 中所述通过了该测试。

示例 51 展示了如果 子测试 ex:testq1 失败,描述将是什么样子。特别是, dcterms:descriptionearl:info 以人类可读形式提供额外警告或错误 消息。

根据关于测试所需细节的不同,[VOCAB-DQV] 也可以 表达测试活动和错误。在 示例 52中,ex:error 是表示前述错误的 质量注解,而 ex:testResult 被定义为 dqv:QualityMetadata,用于收集上述注解和提供出处信息的符合性测量。

当然,上述建模模式可以表示任何质量测试,而不仅仅是对 标准的一致性。

15. 限定关系

本节为非规范性内容。

DCAT 包含用于支持描述数据集和数据服务诸多方面的元素。不过, 为了完整表达某些关系的语义,还需要额外信息。例如, 虽然 [DCTERMS] 提供了标准角色 创建者贡献者发布者,用于将资源归属于某个责任方或代理,但还 有许多其他潜在角色,例如参见 [ISO-19115-1] 中的 CI_RoleCode 值。 类似地,虽然 [DCTERMS] 和 [PROV-O] 提供了一些属性来 捕获资源之间的关系,包括 派生自引用自是……的 版本引用以及其他若干关系,但在 [ISO-19115-1] 的 DS_AssociationTypeCodes、 IANA Link Relations 注册表 [IANA-RELATIONS]、DataCite 元数据 模式 [DataCite] 以及 MARC relators 中还可以看到许多额外关注点。 尽管这些关系可以通过 dcterms:relationdcterms:contributor 等的额外子属性来捕获,但这会导致属性数量激增,而且潜在角色和 关系的完整集合无论如何都是未知的。

满足这类需求的一种常见方法是引入一个额外资源,用于携带 限定该关系的参数。先例包括 [PROV-O] 中的 限定术语,以及 Semantic Sensor Network ontology [VOCAB-SSN] 中的 样本关系。通用的 限定关系模式在 [LinkedDataPatterns] 中有所描述。

[PROV-O] 中的许多限定术语与目录中资源的描述 相关,但由于 PROV-O 采用以活动为中心的视角,这些术语并不完整。为弥补 一些空缺,DCAT 词汇表中加入了额外形式,以满足不涉及显式活动的需求。 这些内容总结于 6

DCAT 限定关系的 UML 模型
6 限定关系支持一组可扩展的角色,用于将资源关联到代理或其他 资源

请注意,虽然这些限定形式的重点是允许在关系上附加额外的角色, 但关系的其他方面,例如适用的时间间隔,也可以在使用特定节点 像这样描述关系时轻松附加(例如,参见 [PROV-O] 中的 Influence 关系图的一些示例)。

15.1 数据集和 代理之间的关系

标准的 [DCTERMS] 属性 dcterms:contributordcterms:creatordcterms:publisher,以及 [PROV-O] 中的通用 prov:wasAttributedTo, 支持责任代理与已编目资源之间的基本关联。 然而,与数据集和服务相关的重要角色还有许多——例如资助者、 分发者、保管者、编辑者。 其中一些角色列举于 [ISO-19115-1] 的 CI_RoleCode 值、[DataCite] 元数据模式,以及 MARC relators 中。

通过使用 [PROV-O] 中的限定形式 prov:qualifiedAttribution, 可以提供一种通用方法,用于以指定角色将代理分配给资源。 示例 53 提供了说明:

示例 53 中,角色由来自 [ISO-19115-1] 中 CI_RoleCode 代码列表的一种非规范、不可解引用表示中的 IRI 表示(例如类似 urn:example:isotc211/CI_RoleCode 的 URN)。 可用时,应优先使用可解引用且规范的链接数据表示。

15.2 数据集和其他资源之间的关系

标准的 [DCTERMS] 属性 dcterms:relation 及其子属性,例如 dcterms:hasPart / dcterms:isPartOfdcterms:hasVersion / dcterms:isVersionOfdcterms:replaces / dcterms:isReplacedBydcterms:requires / dcterms:isRequiredByprov:wasDerivedFromprov:wasQuotedFrom, 支持描述数据集与其他已编目资源之间的关系。 然而,还有许多其他重要关系——例如 alternate、canonical、original、 preview、stereo-mate、working-copy-of。 其中一些角色列举于 [ISO-19115-1] 的 DS_AssociationTypeCodes 值、IANA Link Relations 注册表 [IANA-RELATIONS]、 [DataCite] 元数据模式中,并包含在 MARC relators 中。

通过使用限定形式 dcat:qualifiedRelation, 可以提供一种通用方法,用于以指定角色将一个资源关联到另一个资源。 示例 54 提供了说明:

示例 54 中,角色由来自 [IANA-RELATIONS] 的 IRI 以及来自 [ISO-19115-1] 中 DS_AssociationTypeCode 代码列表的(非规范性)链接 数据表示中的 IRI 表示。

16. DCAT 配置文件

本节为非规范性内容。

DCAT-2014 词汇表 [VOCAB-DCAT-1] 和 DCAT 2 [VOCAB-DCAT-2] 已被扩展,用于 不同领域的数据目录。 每个新规范构成一个 DCAT 配置文件,即一个基于 DCAT 的命名约束集合 (参见 4. 一致性)。在某些情况下, 配置文件会扩展某个 DCAT 配置文件本身,通过添加类和属性来表示 参考 DCAT 配置文件未涵盖的元数据字段。

一些 DCAT 配置文件包括:

17. 安全与隐私 考量

DCAT 词汇表支持可能包含个人信息或私密信息的数据集。此外,使用 DCAT 表达的元数据本身也可能包含个人信息或私密信息,例如资源创建者发布者, 以及通过 限定关系描述的其他各方或代理。 生产、维护、发布或消费这类词汇表术语的实现者必须采取措施,确保 安全和隐私考量得到处理。敏感数据和元数据必须安全存储,并且 只能根据所涉及数据类型的法律和功能要求提供给授权方。 详细说明如何保护 Web 内容和认证用户超出了 DCAT 的范围。

某些数据集需要完整性和真实性保证(例如关于软件漏洞的数据)。 对于这些数据集,校验和可以作为一种验证类型。 DCAT 从 [SPDX] 借用了 spdx:Checksum 类,以确保 DCAT 分发的 完整性和真实性。发布者可以为分发中的每个资源提供校验和值(哈希) 以及用于生成该哈希的算法。不过,校验和必须通过与其汇总的数据 分离的路径提供。它可以包含在与数据一起提供的元数据中(例如,一个 tarfile 包含分发文件和一个元数据文件,后者包含该分发文件的校验和),但如果这样做, 还必须另行提供该校验和,或提供元数据的校验和,以阻止攻击者 同时篡改校验和和数据。如果元数据的完整性和真实性本身也未得到保证, 那么 DCAT 元数据中提供的校验和将无法提供预期保证。

DCAT 数据的完整性和真实性最终取决于来源的可信度。DCAT 提供者应在应用层和传输层处理完整性和真实性。例如,他们应确保其 API 和下载端点的完整性和真实性, 使 DCAT 数据和元数据文件可从权威 HTTPS 源下载,并通过与其所表示数据 分离的通道提供任何校验和。

18. 无障碍考量

DCAT 词汇表提供了一种用于描述数据目录的模型。目录中数据的性质 取决于具体应用领域,并且可能包括非文本数据。可行时,重要的是 通过 DCAT 配置文件机制或支持创建和编辑此类数据的系统,对非文本数据资源 强制提供替代文本,以提升数据的无障碍性。为任何非文本内容提供 文本替代的做法,使其可以转换成人们所需的其他形式,例如大字、 盲文、语音、符号或更简单的语言,这符合 [UNDERSTANDING-WCAG20] 中包含的无障碍指南。

A. 致谢

编辑们衷心感谢 工作组所有成员对本文档所作的贡献,尤其是 Annette Greiner, Antoine Isaac, Dan Brickley, Karen Coyle, Lars G. Svensson, Makx Dekkers, Nicholas Car, Rob Atkinson, Tom Baker.

编辑们还要感谢以下人员提供的评论: Addison Phillips, Alex Nelson, Andreas Geißner, Andreas Kuckartz, Anna Odgaard Ingram, Aymen Charef, Bart Hanssens, Becky Gibson, Bert van Nuffelen, Bob Coret, Brian Donohue, Chavdar Ivanov, Claus Stadler, Cristiano Longo, Christophe Dzikowski, Dimitris Zeginis, Dominik Schneider, Emidio Stani, Ivo Velitchkov, Jakob Voß, Jakub Klímek, Jan Voskuil, Jim J. Yang, Joep Meindertsma, Joep van Genuchten, Katherine Anderson Aur, Ludger A. Rinsche, Marielle Adam, Martial Honsberger, Mathias Bonduel, Mathias Richter, Matthias Palmér, Nancy Jean, Nuno Freire, Øystein Åsnes, Paul van Genuchten, Pieter J. C. van Everdingen, Renato Iannella, Rajaram Kaliyaperumal, Robin Gower, Sabine Maennel, Sebastian Hellman, Simson L. Garfinkel, Siri Jodha S. Khalsa, Stefan Ollinger, Stephen Richard, Stian Soiland-Reyes, Stig B. Dørmænen, Susheel Varma, Sidney Cox, Thomas Francart, Vittorio Meloni, Wouter Beek, Yves Coene.

编辑们还衷心感谢本工作组的主席 Caroline Burle 和 Peter Winstanley ——以及团队联系人 Philippe Le Hégaret 和 Pierre-Antoine Champin。

B. 与 Schema.org 对齐

本节为非规范性内容。

Schema.org [SCHEMA-ORG] 包含若干基于原始 DCAT 工作的类型和属性 (参见 sdo:Dataset 作为起点), 并且 Google 的 Dataset Search 服务索引依赖于 网页中关于数据集的结构化描述,其中同时使用 schema.org 和 DCAT。 将上文 1 所示的 DCAT 主干与 7 中 [SCHEMA-ORG] 的相关类 进行比较,可以看出相似性,特别是:。

与数据集目录相关的 schema.org 类和属性的 UML 模型
7 schema.org 对数据集目录的支持,展示了与所示类相关的一组 schema.org 属性

使用元数据的通用 Web 搜索服务主要依赖 [SCHEMA-ORG],因此 DCAT 与 [SCHEMA-ORG] 的关系,对希望其数据集和服务通过这些索引 暴露的数据提供者和目录发布者而言具有意义。

DCAT 1 与 schema.org 之间的映射曾在 扩展 [SCHEMA-ORG] 以描述数据集和数据 目录的原始提案中讨论过。 DCAT 1 [VOCAB-DCAT-1] 与 [SCHEMA-ORG] 之间的 部分映射早先由 Spatial Data on the Web Working Group 在前期工作基础上提供。

从修订后的 DCAT(本文档)到 [SCHEMA-ORG] 3.4 版的 推荐映射可在 RDF 文件中获得。 该映射使用谓词 rdfs:subClassOfrdfs:subPropertyOfowl:equivalentClassowl:equivalentPropertyskos:closeMatch 进行公理化, 并使用注解属性 sdo:domainIncludessdo:rangeIncludes 来匹配 [SCHEMA-ORG] 语义。该对齐在下表中总结, 其中前缀 sdo 表示 http://schema.org/

DCAT 元素 来自 schema.org 的目标元素
dcat:Resource sdo:Thing
dcterms:title sdo:name
dcterms:description sdo:description
dcat:keyword
dcat:keyword 是单数,sdo:keywords 是复数
sdo:keywords
dcat:theme sdo:about
dcterms:identifier sdo:identifier
dcterms:type sdo:additionalType
dcterms:issued sdo:datePublished
dcterms:modified sdo:dateModified
dcterms:language sdo:inLanguage
dcterms:relation sdo:isRelatedTo
dcat:landingPage sdo:url
dcterms:publisher sdo:publisher
dcat:contactPoint sdo:contactPoint
dcat:version sdo:version
dcat:Catalog sdo:DataCatalog
dcterms:hasPart sdo:hasPart
dcat:dataset sdo:dataset
dcat:distribution sdo:distribution
dcat:Dataset sdo:Dataset
dcat:Dataset
dcterms:accrualPeriodicity 固定为
<http://purl.org/cld/freq/continuous>
sdo:DataFeed
dcterms:spatial sdo:spatialCoverage
dcterms:temporal sdo:temporalCoverage
dcterms:accrualPeriodicity sdo:repeatFrequency
prov:wasGeneratedBy [ owl:inverseOf sdo:result ]
dcat:inSeries sdo:isPartOf
dcat:DatasetSeries sdo:CreativeWorkSeries
dcat:Distribution sdo:DataDownload
dcterms:format sdo:encodingFormat
dcat:mediaType sdo:encodingFormat
dcat:byteSize sdo:contentSize
dcat:accessURL sdo:contentUrl
dcat:downloadURL sdo:contentUrl
dcterms:license sdo:license
dcat:DataService sdo:WebAPI
dcat:endpointURL sdo:url
dcat:endpointDescription sdo:documentation, sdo:hasOfferCatalog
dcterms:type
在 dcat:DataService 的上下文中
sdo:serviceType
dcat:servesDataset sdo:serviceOutput
dcat:Relationship sdo:Role

C. 示例

本节为非规范性内容。

C.1 松散结构化目录

在许多遗留目录和存储库(例如 CKAN)中,“数据集”只是“一袋文件”。并不 区分分发(表示),以及从数据集到每个文件的其他类型关系(例如 文档、模式、支持文档)。

如果目录、存储库或其他地方的数据集与组成资源之间关系的性质 未知,则可以使用 dcterms:relation 或其子属性 dcterms:hasPart

如果关系的性质已知,则应使用其他 dcterms:relation 的子属性来传达这一点。 特别是,如果明确这些相关资源中的任何一个是数据集的适当表示, 则应使用 dcat:distribution

此示例可从 DXWG DCAT 3 代码 存储库中的 csiro-dap-examples.ttlcsiro-stratchart_dcat3.ttl 获得。

关于相关资源性质的额外细节,可以使用其他 RDF 词汇表中的合适元素, 并结合 DCAT 的数据集描述符给出。例如,上述示例可以更完整地表达如下 (嵌入的注释解释了图中的不同资源):

此示例可从 DXWG DCAT 3 代码 存储库中的 csiro-stratchart.ttl 获得。

C.2 数据集出处

数据集的出处或业务上下文可以使用 W3C Provenance Ontology [PROV-O] 中的元素来描述。

例如,从数据集描述到生成该数据集的项目的一个简单链接可以 形式化如下(为清楚起见省略其他细节):

此示例可从 DXWG DCAT 3 代码 存储库中的 csiro-dap-examples.ttl 获得。

若干属性会捕获出处信息,包括在引用和标题中,但指向项目正式描述的 主要链接是通过 prov:wasGeneratedBy。 项目的简略描述显示为 prov:Activity,尽管这并不 一定是同一目录的一部分。 请注意,由于该项目仍在进行,该活动没有结束日期。

可以使用 PROV 中其他起点属性提供进一步出处信息,尤其是 prov:wasAttributedTo(用于 链接到与数据集生产相关的代理)和 prov:wasDerivedFrom(用于链接到 前身数据集)。这二者均补充了 DCAT 中已经使用的 Dublin Core 属性,如下:

关于用于资源归属和相互关系的限定属性的更多模式,见 15. 限定关系

数据集通常与出版物(学术文章、报告等)相关联,DCAT 依赖于属性 dcterms:isReferencedBy 来 提供一种将关于数据集的出版物链接到该数据集的方式

以下示例展示了如何将发布在 Dryad 存储库中的数据集链接到 Nature Scientific Data 期刊中的出版物:

此示例可从 DXWG DCAT 3 代码 存储库中的 dryad-globtherm-sdata.ttl 获得

C.4 数据服务

可以使用 DCAT 描述数据服务。 分类器 dcterms:typedcterms:conformsTodcat:endpointDescription 的值,会对服务提供逐步更详细的说明; 服务的实际端点由 dcat:endpointURL 给出。

第一个示例描述了由 European Environment Agency (EEA) 托管的数据目录。 它被分类为 dcat:DataService,并且 dcterms:type 设置为 INSPIRE 空间数据服务类型分类 [INSPIRE-SDST] 中的 “discovery”。

此示例可从 DXWG DCAT 3 代码 存储库中的 eea-csw.ttl 获得

示例 61 展示了由 Geoscience Australia 托管的数据集,该数据集可从三个不同服务获得,正如每个服务描述中 dcat:servesDataset 属性的值所指示。 这些服务被分类为 dcat:DataService,并且 dcterms:type 也设置为 INSPIRE 空间数据服务类型分类 [INSPIRE-SDST] 中的 “download” 和 “view”。

示例 61 可从 DXWG DCAT 3 代码 存储库中的 ga-courts.ttl 获得

C.5 压缩和打包的 分发

第一个示例是具有可下载文件的分发,该文件被压缩为 GZIP 文件。

第二个示例是具有多个文件的分发,这些文件被打包进一个 TAR 文件。

第三个示例是具有多个文件的分发,这些文件被打包进一个 TAR 文件,并且该 TAR 文件已被 压缩为 GZIP 文件。

这些示例可从 DXWG DCAT 3 代码 存储库中的 compress-and-package.ttl 获得

D. 变更历史

完整变更日志可在 GitHub 上获得

E. 自 2024 年 1 月 18 日候选推荐快照以来的变更

自 2024 年 1 月 18 日候选推荐快照 [VOCAB-DCAT-3-20240118] 以来, 本文档经历了以下变更:

F. 自 2022 年 5 月 10 日第四份公开工作草案以来的变更

自 2022 年 5 月 10 日 DCAT 3 第四份公开工作草案 [VOCAB-DCAT-3-20220510] 以来, 本文档经历了以下变更:

G. 自 2022 年 1 月 11 日第三份公开工作草案以来的变更

自 2022 年 1 月 11 日 DCAT 3 第三份公开工作草案 [VOCAB-DCAT-3-20220111] 以来, 本文档经历了以下变更:

H. 自 2021 年 5 月 4 日第二份公开工作草案以来的变更

自 2021 年 5 月 4 日 DCAT 3 第二份公开工作草案 [VOCAB-DCAT-3-20210504] 以来, 本文档经历了以下变更:

I. 自 2020 年 12 月 17 日第一份公开工作草案以来的变更

自 2020 年 12 月 17 日 DCAT 3 第一份公开工作草案 [VOCAB-DCAT-3-20201217] 以来, 本文档经历了以下变更:

J. 自 2020 年 2 月 4 日 W3C 推荐标准以来的变更

自 2020 年 2 月 4 日 DCAT 2 W3C 推荐标准 [VOCAB-DCAT-2-20200204] 以来, 本文档经历了以下变更:

K. 参考文献

K.1 规范性参考文献

[DC11]
Dublin Core Metadata Element Set, Version 1.1. DCMI. 2012 年 6 月 14 日。DCMI 推荐标准。URL:http://dublincore.org/documents/dces/
[DCTERMS]
DCMI Metadata Terms. DCMI Usage Board. DCMI. 2020 年 1 月 20 日。DCMI 推荐标准。URL:https://www.dublincore.org/specifications/dublin-core/dcmi-terms/
[DWBP]
Data on the Web Best Practices. Bernadette Farias Loscio; Caroline Burle; Newton Calegari. W3C. 2017 年 1 月 31 日。W3C 推荐标准。URL:https://www.w3.org/TR/dwbp/
[FOAF]
FOAF Vocabulary Specification 0.99 (Paddington Edition). Dan Brickley; Libby Miller. FOAF project. 2014 年 1 月 14 日。URL:http://xmlns.com/foaf/spec
[GeoSPARQL]
OGC GeoSPARQL - A Geographic Query Language for RDF Data. Nicholas J. Car; Timo Homburg; Matthew Perry; Frans Knibbe; Simon J.D. Cox; Joseph Abhayaratna; Mathias Bonduel; Paul J. Cripps; Krzysztof Janowicz. OGC. 2024 年 1 月 29 日。OGC 标准。URL:https://docs.ogc.org/is/22-047r1/22-047r1.html
[IANA-MEDIA-TYPES]
Media Types. IANA. URL:https://www.iana.org/assignments/media-types/
[LOCN]
ISA Programme Location Core Vocabulary. Andrea Perego; Michael Lutz. European Commission. 2015 年 3 月 23 日。w3.org/ns 空间中的第二版。URL:http://www.w3.org/ns/locn
[ODRL-MODEL]
ODRL Information Model 2.2. Renato Iannella; Serena Villata. W3C. 2018 年 2 月 15 日。W3C 推荐标准。URL:https://www.w3.org/TR/odrl-model/
[ODRL-VOCAB]
ODRL Vocabulary & Expression 2.2. Renato Iannella; Michael Steidl; Stuart Myles; Víctor Rodríguez-Doncel. W3C. 2018 年 2 月 15 日。W3C 推荐标准。URL:https://www.w3.org/TR/odrl-vocab/
[OWL-TIME]
Time Ontology in OWL. Simon Cox; Chris Little. W3C. 2022 年 11 月 15 日。W3C 候选推荐标准。URL:https://www.w3.org/TR/owl-time/
[OWL2-OVERVIEW]
OWL 2 Web Ontology Language Document Overview (Second Edition). W3C OWL Working Group. W3C. 2012 年 12 月 11 日。W3C 推荐标准。URL:https://www.w3.org/TR/owl2-overview/
[OWL2-SYNTAX]
OWL 2 Web Ontology Language Structural Specification and Functional-Style Syntax (Second Edition). Boris Motik; Peter Patel-Schneider; Bijan Parsia. W3C. 2012 年 12 月 11 日。W3C 推荐标准。URL:https://www.w3.org/TR/owl2-syntax/
[PAV]
PAV - Provenance, Authoring and Versioning. Version 2.3.1. Paolo Ciccarese; Stian Soiland-Reyes. Mind Informatics. 2015 年 3 月 16 日。URL:https://pav-ontology.github.io/pav/
[PROV-O]
PROV-O: The PROV Ontology. Timothy Lebo; Satya Sahoo; Deborah McGuinness. W3C. 2013 年 4 月 30 日。W3C 推荐标准。URL:https://www.w3.org/TR/prov-o/
[RDF-SCHEMA]
RDF Schema 1.1. Dan Brickley; Ramanathan Guha. W3C. 2014 年 2 月 25 日。W3C 推荐标准。URL:https://www.w3.org/TR/rdf-schema/
[RDF-SYNTAX-GRAMMAR]
RDF 1.1 XML Syntax. Fabien Gandon; Guus Schreiber. W3C. 2014 年 2 月 25 日。W3C 推荐标准。URL:https://www.w3.org/TR/rdf-syntax-grammar/
[RFC2119]
Key words for use in RFCs to Indicate Requirement Levels. S. Bradner. IETF. 1997 年 3 月。最佳当前实践。URL:https://www.rfc-editor.org/rfc/rfc2119
[RFC8174]
Ambiguity of Uppercase vs Lowercase in RFC 2119 Key Words. B. Leiba. IETF. 2017 年 5 月。最佳当前实践。URL:https://www.rfc-editor.org/rfc/rfc8174
[SKOS-REFERENCE]
SKOS Simple Knowledge Organization System Reference. Alistair Miles; Sean Bechhofer. W3C. 2009 年 8 月 18 日。W3C 推荐标准。URL:https://www.w3.org/TR/skos-reference/
[SPDX]
SPDX 2.2. SPDX. URL:https://spdx.org/rdf/spdx-terms-v2.2/
[UNDERSTANDING-WCAG20]
Understanding WCAG 2.0. Michael Cooper; Andrew Kirkpatrick; Joshue O'Connor et al. W3C. 2023 年 9 月 21 日。W3C 工作组 注。URL:https://www.w3.org/TR/UNDERSTANDING-WCAG20/
[VCARD-RDF]
vCard Ontology - for describing People and Organizations. Renato Iannella; James McKinney. W3C. 2014 年 5 月 22 日。W3C 工作 组注。URL:https://www.w3.org/TR/vcard-rdf/
[VOCAB-ADMS]
Asset Description Metadata Schema (ADMS). Phil Archer; Gofran Shukair. W3C. 2013 年 8 月 1 日。W3C 工作组注。 URL:https://www.w3.org/TR/vocab-adms/
[VOCAB-DCAT]
Data Catalog Vocabulary (DCAT). Fadi Maali; John Erickson. W3C. 2020 年 2 月 4 日。W3C 推荐标准。URL:https://www.w3.org/TR/vocab-dcat/
[XMLSCHEMA11-2]
W3C XML Schema Definition Language (XSD) 1.1 Part 2: Datatypes. David Peterson; Sandy Gao; Ashok Malhotra; Michael Sperberg-McQueen; Henry Thompson; Paul V. Biron et al. W3C. 2012 年 4 月 5 日。W3C 推荐标准。URL: https://www.w3.org/TR/xmlschema11-2/

K.2 资料性参考文献

[ADMS-SKOS]
Joinup. ADMS Controlled Vocabularies. European Commission. URL:https://web.archive.org/web/20210521035614/https://joinup.ec.europa.eu/svn/adms/ADMS_v1.00/ADMS_SKOS_v1.00.html
[ANNOTATION-VOCAB]
Web Annotation Vocabulary. Robert Sanderson; Paolo Ciccarese; Benjamin Young. W3C. 2017 年 2 月 23 日。W3C 推荐标准。URL:https://www.w3.org/TR/annotation-vocab/
[BCP47]
Tags for Identifying Languages. A. Phillips, Ed.; M. Davis, Ed.. IETF. 2009 年 9 月。最佳当前实践。URL:https://www.rfc-editor.org/rfc/rfc5646
[CSW]
Catalogue Services 3.0 - General Model. Douglas Nebert; Uwe Voges; Lorenzo Bigagli. OGC. 2016 年 6 月 10 日。URL:http://www.opengeospatial.org/standards/cat
[DataCite]
DataCite Metadata Schema. DataCite Metadata Working Group. DataCite e.V. 2024 年 1 月 22 日。URL:https://schema.datacite.org/
[DATETIME]
Date and Time Formats. W3C. 1998 年 8 月 27 日。W3C 工作组注。URL:https://www.w3.org/TR/NOTE-datetime
[DATS]
Data Tag Suite. Alejandra Gonzalez-Beltran; Philippe Rocca-Serra. NIH Big Data 2 Knowledge bioCADDIE and NIH Data Commons projects. 2016. URL:https://datatagsuite.github.io/docs/html/
[DBPEDIA-ONT]
DBPedia ontology. URL:http://dbpedia.org/ontology/
[DCAP]
Guidelines for Dublin Core Application Profiles. Karen Coyle; Thomas Baker. DCMI. 2009 年 5 月 18 日。DCMI 推荐资源。URL:http://dublincore.org/documents/profile-guidelines/
[DCAT-AP]
DCAT Application Profile for data portals in Europe. Version 2.0.1. European Commission. 2020 年 6 月 8 日。URL:https://joinup.ec.europa.eu/solution/dcat-application-profile-data-portals-europe
[DCAT-AP-IT]
Profilo metadatazione DCAT-AP_IT. AgID & Team Digitale. URL:https://docs.italia.it/italia/daf/linee-guida-cataloghi-dati-dcat-ap-it/it/stabile/dcat-ap_it.html
[DCAT-AP-NO]
Standard for beskrivelse av datasett, datatjenester og datakataloger (DCAT-AP-NO). URL:https://data.norge.no/specification/dcat-ap-no/
[DCAT-AP-SE]
DCAT-AP-SE: Clarifications, translations and explanations of DCAT-AP for Sweden. Matthias Palmér. URL:https://docs.dataportal.se/dcat/en/
[DCAT-AP.de]
Vokabulare und Dokumente für DCAT-AP.de. URL:https://dcat-ap.de/def/
[DCAT-BE]
Linking data portals across Belgium.. URL:http://dcat.be/
[DCAT-UCR]
Dataset Exchange Use Cases and Requirements. Jaroslav Pullmann; Rob Atkinson; Antoine Isaac; Ixchel Faniel. W3C. 2019 年 1 月 17 日。W3C 工作组注。URL:https://www.w3.org/TR/dcat-ucr/
[DOAP]
Description of a Project. Edd Wilder-James. URL:https://github.com/ewilderj/doap/wiki
[EARL10-Schema]
Evaluation and Report Language (EARL) 1.0 Schema. Shadi Abou-Zahra. W3C. 2017 年 2 月 2 日。W3C 工作组注。URL:https://www.w3.org/TR/EARL10-Schema/
[EUV-AR]
Named Authority List: Access rights. Publications Office of the European Union. URL:https://publications.europa.eu/en/web/eu-vocabularies/at-dataset/-/resource/dataset/access-right
[EUV-CS]
Named Authority List: Concept statuses. Publications Office of the European Union. URL: https://publications.europa.eu/en/web/eu-vocabularies/at-dataset/-/resource/dataset/concept-status
[EUV-DS]
Named Authority List: Dataset statuses. Publications Office of the European Union. URL: https://publications.europa.eu/en/web/eu-vocabularies/at-dataset/-/resource/dataset/dataset-status
[FAIR]
The FAIR Guiding Principles for scientific data management and stewardship. Mark D. Wilkinson et al. Nature. Scientific Data, vol. 3, Article nr. 160018. URL:https://doi.org/10.1038/sdata.2016.18
[GeoDCAT-AP]
GeoDCAT-AP: A geospatial extension for the DCAT application profile for data portals in Europe. European Commission. 2020 年 12 月 23 日。URL:https://semiceu.github.io/GeoDCAT-AP/releases/
[GeoDCAT-AP-IT]
GeoDCAT-AP in Italy, the national guidelines published. URL:https://web.archive.org/web/20200506120557/https://joinup.ec.europa.eu/collection/semantic-interoperability-community-semic/news/geodcat-apit
[HCLS-Dataset]
Dataset Descriptions: HCLS Community Profile. Alasdair Gray; M. Scott Marshall; Michel Dumontier. W3C. 2015 年 5 月 14 日。 W3C 工作组注。URL:https://www.w3.org/TR/hcls-dataset/
[HTML-RDFa]
HTML+RDFa 1.1 - Second Edition. Manu Sporny. W3C. 2015 年 3 月 17 日。W3C 推荐标准。URL:https://www.w3.org/TR/html-rdfa/
[HYDRA]
Hydra Core Vocabulary. Markus Lanthaler. Hydra W3C Community Group. 2018 年 3 月 15 日。非正式草案。URL:https://www.hydra-cg.com/spec/latest/core/
[IANA-RELATIONS]
Link Relations. IANA. URL:https://www.iana.org/assignments/link-relations/
[IANA-URI-SCHEMES]
Uniform Resource Identifier (URI) Schemes. IANA. URL:https://www.iana.org/assignments/uri-schemes/uri-schemes.xhtml
[INSPIRE-DoC]
INSPIRE Registry: Degrees of conformity. European Commission. URL:http://inspire.ec.europa.eu/metadata-codelist/DegreeOfConformity/
[INSPIRE-SDST]
INSPIRE Registry: Spatial data service types. European Commission. URL:http://inspire.ec.europa.eu/metadata-codelist/SpatialDataServiceType/
[ISO-19115]
Geographic information -- Metadata. ISO/TC 211. ISO. 2003. 国际标准。URL:https://www.iso.org/standard/26020.html
[ISO-19115-1]
Geographic information -- Metadata -- Part 1: Fundamentals. ISO/TC 211. ISO. 2014. 国际标准。URL:https://www.iso.org/standard/53798.html
[ISO-19128]
Geographic information -- Web map server interface. ISO/TC 211. ISO. 2005. 国际标准。URL:https://www.iso.org/standard/32546.html
[ISO-19135]
Geographic information -- Procedures for item registration. ISO/TC 211. ISO. 2005. 国际标准。URL:https://www.iso.org/standard/32553.html
[ISO-19142]
Geographic information -- Web Feature Service. ISO/TC 211. ISO. 2010. 国际标准。URL:https://www.iso.org/standard/42136.html
[ISO-26324]
Information and documentation -- Digital object identifier system. ISO/TC 46/SC 9. ISO. 2012. 国际标准。URL: https://www.iso.org/standard/43506.html
[ISO-IEC-25012]
ISO/IEC 25012 - Data Quality model. URL:http://iso25000.com/index.php/en/iso-25000-standards/iso-25012
[JSON-LD]
JSON-LD 1.0. Manu Sporny; Gregg Kellogg; Markus Lanthaler. W3C. 2020 年 11 月 3 日。W3C 推荐标准。URL:https://www.w3.org/TR/json-ld/
[LinkedDataPatterns]
Linked Data Patterns: A pattern catalogue for modelling, publishing, and consuming Linked Data. Leigh Dodds; Ian Davis. 2012 年 5 月 31 日。URL:http://patterns.dataincubator.org/book/
[N3]
Notation3 (N3): A readable RDF syntax. Tim Berners-Lee; Dan Connolly. W3C. 2008 年 1 月 14 日。W3C 团队 提交。URL:https://www.w3.org/TeamSubmission/2008/SUBM-n3-20080114/
[netCDF]
Network Common Data Form (NetCDF). UNIDATA. URL:https://www.unidata.ucar.edu/software/netcdf/
[ODRS]
Open Data Rights Statement Vocabulary. Leigh Dodds. ODI. 2013 年 7 月 29 日。URL:http://schema.theodi.org/odrs
[OpenAPI]
OpenAPI Specification. Darrell Miller; Jason Harmon; Jeremy Whitlock; Marsh Gardiner; Mike Ralphson; Ron Ratovsky; Tony Tam; Uri Sarid. OpenAPI Initiative. URL:https://www.openapis.org/
[OpenSearch]
OpenSearch 1.1 Draft 6. DeWitt Clinton. OpenSearch. 2018 年 4 月 17 日。URL:https://github.com/dewitt/opensearch/blob/master/opensearch-1-1-draft-6.md
[RDF11-CONCEPTS]
RDF 1.1 Concepts and Abstract Syntax. Richard Cyganiak; David Wood; Markus Lanthaler. W3C. 2014 年 2 月 25 日。 W3C 推荐标准。URL:https://www.w3.org/TR/rdf11-concepts/
[RDF11-PRIMER]
RDF 1.1 Primer. Guus Schreiber; Yves Raimond. W3C. 2014 年 6 月 24 日。W3C 工作组注。URL:https://www.w3.org/TR/rdf11-primer/
[RE3DATA-SCHEMA]
Metadata Schema for the Description of Research Data Repositories: version 3. Jessika Rücknagel et al. GFZ Potsdam. 2015 年 12 月 17 日。 URL:https://doi.org/10.2312/re3.008
[RFC3986]
Uniform Resource Identifier (URI): Generic Syntax. T. Berners-Lee; R. Fielding; L. Masinter. IETF. 2005 年 1 月。互联网 标准。URL:https://www.rfc-editor.org/rfc/rfc3986
[RFC3987]
Internationalized Resource Identifiers (IRIs). M. Duerst; M. Suignard. IETF. 2005 年 1 月。提议标准。URL:https://www.rfc-editor.org/rfc/rfc3987
[SCHEMA-ORG]
Schema.org. URL:https://schema.org/
[SDW-BP]
Spatial Data on the Web Best Practices. Payam Barnaghi; Jeremy Tandy; Linda van den Brink; Timo Homburg. W3C. 2023 年 9 月 19 日。W3C 工作 组注。URL:https://www.w3.org/TR/sdw-bp/
[SHACL]
Shapes Constraint Language (SHACL). Holger Knublauch; Dimitris Kontokostas. W3C. 2017 年 7 月 20 日。W3C 推荐标准。URL:https://www.w3.org/TR/shacl/
[ShEx]
Shape Expressions Language 2.1. Shape Expressions W3C Community Group. 2018 年 11 月 17 日。社区组报告草案。URL:http://shex.io/shex-semantics/
[SPARQL11-PROTOCOL]
SPARQL 1.1 Protocol. Lee Feigenbaum; Gregory Williams; Kendall Clark; Elias Torres. W3C. 2013 年 3 月 21 日。W3C 推荐标准。 URL:https://www.w3.org/TR/sparql11-protocol/
[SPARQL11-QUERY]
SPARQL 1.1 Query Language. Steven Harris; Andy Seaborne. W3C. 2013 年 3 月 21 日。W3C 推荐标准。URL:https://www.w3.org/TR/sparql11-query/
[SPARQL11-SERVICE-DESCRIPTION]
SPARQL 1.1 Service Description. Gregory Williams. W3C. 2013 年 3 月 21 日。W3C 推荐标准。URL:https://www.w3.org/TR/sparql11-service-description/
[StatDCAT-AP]
StatDCAT-AP – DCAT Application Profile for description of statistical datasets. Version 1.0.1. European Commission. 2019 年 5 月 28 日。URL:https://joinup.ec.europa.eu/solution/statdcat-application-profile-data-portals-europe
[Turtle]
RDF 1.1 Turtle. Eric Prud'hommeaux; Gavin Carothers. W3C. 2014 年 2 月 25 日。W3C 推荐标准。URL:https://www.w3.org/TR/turtle/
[UKGOVLD-REG]
Linked Data Registry - Principles and Concepts. UK Government Linked Data Working Group. URL: https://github.com/UKGovLD/registry-core/wiki/Principles-and-concepts
[VIVO-ISF]
VIVO-ISF Data Standard. URL:https://github.com/vivo-isf/vivo-isf
[VOCAB-DATA-CUBE]
The RDF Data Cube Vocabulary. Richard Cyganiak; Dave Reynolds. W3C. 2014 年 1 月 16 日。W3C 推荐标准。URL:https://www.w3.org/TR/vocab-data-cube/
[VOCAB-DCAT-1]
Data Catalog Vocabulary (DCAT). Fadi Maali; John Erickson. W3C. 2020 年 2 月 4 日。W3C 推荐标准。URL:https://www.w3.org/TR/vocab-dcat-1/
[VOCAB-DCAT-2]
Data Catalog Vocabulary (DCAT) - Version 2. Riccardo Albertoni; David Browning; Simon Cox; Alejandra Gonzalez Beltran; Andrea Perego; Peter Winstanley. W3C. 2020 年 2 月 4 日。W3C 推荐标准。URL:https://www.w3.org/TR/vocab-dcat-2/
[VOCAB-DCAT-2-20200204]
Data Catalog Vocabulary (DCAT) - Version 2. Riccardo Albertoni; David Browning; Simon Cox; Alejandra Gonzalez Beltran; Andrea Perego; Peter Winstanley. W3C. 2020 年 2 月 4 日。W3C 推荐标准。URL:https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/
[VOCAB-DCAT-3-20201217]
Data Catalog Vocabulary (DCAT) - Version 3. Riccardo Albertoni; David Browning; Simon Cox; Alejandra Gonzalez Beltran; Andrea Perego; Peter Winstanley. W3C. 2020 年 12 月 17 日。W3C 工作草案。URL:https://www.w3.org/TR/2020/WD-vocab-dcat-3-20201217/
[VOCAB-DCAT-3-20210504]
Data Catalog Vocabulary (DCAT) - Version 3. Riccardo Albertoni; David Browning; Simon Cox; Alejandra Gonzalez Beltran; Andrea Perego; Peter Winstanley. W3C. 2021 年 5 月 4 日。W3C 工作草案。URL:https://www.w3.org/TR/2021/WD-vocab-dcat-3-20210504/
[VOCAB-DCAT-3-20220111]
Data Catalog Vocabulary (DCAT) - Version 3. Riccardo Albertoni; David Browning; Simon Cox; Alejandra Gonzalez Beltran; Andrea Perego; Peter Winstanley. W3C. 2022 年 1 月 11 日。W3C 工作草案。URL:https://www.w3.org/TR/2022/WD-vocab-dcat-3-20220111/
[VOCAB-DCAT-3-20220510]
Data Catalog Vocabulary (DCAT) - Version 3. Riccardo Albertoni; David Browning; Simon Cox; Alejandra Gonzalez Beltran; Andrea Perego; Peter Winstanley. W3C. 2022 年 5 月 10 日。W3C 工作草案。URL:https://www.w3.org/TR/2022/WD-vocab-dcat-3-20220510/
[VOCAB-DCAT-3-20240118]
Data Catalog Vocabulary (DCAT) - Version 3. Simon Cox; Andrea Perego; Alejandra Gonzalez Beltran; Peter Winstanley; Riccardo Albertoni; David Browning. W3C. 2024 年 1 月 18 日。W3C 候选推荐标准。 URL:https://www.w3.org/TR/2024/CR-vocab-dcat-3-20240118/
[VOCAB-DQV]
Data on the Web Best Practices: Data Quality Vocabulary. Riccardo Albertoni; Antoine Isaac. W3C. 2016 年 12 月 15 日。W3C 工作 组注。URL:https://www.w3.org/TR/vocab-dqv/
[VOCAB-ORG]
The Organization Ontology. Dave Reynolds. W3C. 2014 年 1 月 16 日。W3C 推荐标准。URL:https://www.w3.org/TR/vocab-org/
[VOCAB-SSN]
Semantic Sensor Network Ontology. Armin Haller; Krzysztof Janowicz; Simon Cox; Danh Le Phuoc; Kerry Taylor; Maxime Lefrançois. W3C. 2017 年 10 月 19 日。W3C 推荐标准。URL:https://www.w3.org/TR/vocab-ssn/
[VOID]
Describing Linked Datasets with the VoID Vocabulary. Keith Alexander; Richard Cyganiak; Michael Hausenblas; Jun Zhao. W3C. 2011 年 3 月 3 日。W3C 工作组注。URL:https://www.w3.org/TR/void/
[W3C-BASIC-GEO]
Basic Geo (WGS84 lat/long) Vocabulary. Dan Brickley. W3C Semantic Web Interest Group. 2006 年 2 月 1 日。URL:https://www.w3.org/2003/01/geo/
[WFS]
Web Feature Service 2.0 Interface Standard. Panagiotis (Peter) A. Vretanos. OGC. 2014 年 7 月 10 日。OGC 接口 标准。URL:http://www.opengeospatial.org/standards/wfs
[WMS]
Web Map Service Implementation Specification. Jeff de la Beaujardiere. OGC. 2006 年 3 月 15 日。OpenGIS 实现标准。URL:http://www.opengeospatial.org/standards/wms
[WSDL20]
Web Services Description Language (WSDL) Version 2.0 Part 1: Core Language. Roberto Chinnici; Jean-Jacques Moreau; Arthur Ryman; Sanjiva Weerawarana et al. W3C. 2007 年 6 月 26 日。W3C 推荐标准。URL:https://www.w3.org/TR/wsdl20/
[XHTML-VOCAB]
XHTML Vocabulary. XHTML 2 Working Group. W3C. 2010 年 10 月 27 日。URL:https://www.w3.org/1999/xhtml/vocab
[ZaveriEtAl]
Quality assessment for Linked Data: A Survey. Amrapali Zaveri et al. IOS Press. 2015. Semantic Web, vol. 7, no. 1, pp. 63-93. URL:https://doi.org/10.3233/SW-150175