欧洲语言网格平台:基本概念解析
立即解锁
发布时间: 2025-09-03 00:33:05 阅读量: 11 订阅数: 14 AIGC 


欧洲语言网格平台解析
# 欧洲语言网格平台:基本概念解析
## 1. ELG 架构与标准
在 ELG 平台中,对于有分支机构的公司,母公司和各部门均可注册,并能建立它们之间的关联。为实现标准化,ELG 模式更倾向于使用受控词汇表,而非自由文本字段,尤其是当这些词汇与国际公认的标准、最佳实践或广泛使用的词汇表相关时,例如使用 ISO 3166 作为地区代码,RFC 5646 用于标识语言。
ELG 以 XML 模式定义(XSD)的形式实现,它引入了两个本体中的元素:MS - OWL 本体,包含了大多数元素和受控词汇表;OMTD - SHARE 本体,用于 LT 类别(也称为“LT 分类法”)、数据格式、注释类型和方法的受控词汇表。
## 2. 出版物生命周期
ELG 高度重视元数据记录的质量,因为这对资源的发现和使用至关重要。ELG 定义了一套政策,考虑了记录录入 ELG 目录的来源和过程。其出版物生命周期包含以下几个阶段:
- **新建项目**:提供者上传元数据文件或使用交互式编辑器创建新项目。
- **草稿状态**:若记录无效(并非所有必填元素都已填写),提供者需继续编辑。在此状态下,除了对元数据元素的数据类型进行验证(如确保 URL 格式正确)外,不进行其他验证检查。
- **语法有效状态**:所有必填元数据元素都已填写,但提供者仍可继续编辑,直至对描述满意后提交发布。
- **提交发布**:提供者对元数据满意并提交记录进行发布,此时会通过电子邮件通知提供者。
- **验证中**:ELG 技术团队会对元数据进行元数据、技术和法律层面的验证,旨在检查描述的一致性以及技术合规性,但不包括对资源本身的定性评估。若验证者发现问题,会联系提供者并建议对元数据进行更改和补充,记录状态将再次变为语法有效,提供者会收到通知进行相应修改。
- **批准并发布**:验证者批准项目后,元数据记录将在 ELG 目录上发布,且不可再编辑。
以下是 ELG 出版物生命周期的 mermaid 流程图:
```mermaid
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
classDef decision fill:#FFF6CC,stroke:#FFBC52,stroke-width:2px;
A([新建项目]):::startend --> B{记录是否有效?}:::decision
B -->|否| C(草稿状态):::process
C --> D(语法有效状态):::process
D --> E(提交发布):::process
E --> F(验证中):::process
F -->|有问题| D
F -->|无问题| G([批准并发布]):::startend
B -->|是| D
```
个人添加的元数据记录需经历整个发布生命周期,人工验证旨在确保记录包含最低质量标准,这可通过与提供者的交互实现。但对于从其他目录自动导入的元数据记录,信息质量和完整性的责任在于源目录。对于通过批量计划添加的记录,如欧洲语言平等项目中的 LRT 协作调查,也采用接受记录原样的政策。
## 3. ELG 与 FAIR 原则
FAIR 原则的发布为支持数据资源共享和再利用的基础设施树立了里程碑。这些原则旨在通过提高数据的可发现性、可访问性、互操作性和可再利用性来增强数据的再利用能力,既适用于人类,也强调机器的可操作性。ELG 已实施相关机制和政策,确保其包含的资源(数据和软件)以及描述它们的元数据符合 FAIR 原则。
### 3.1 可发现性原则
- **F1**:(元)数据被分配全局唯一且持久的标识符。ELG 托管的资源和兼容服务会分配由 DataCite 提供的 DOI(数字对象标识符),
0
0
复制全文
相关推荐










