数据仓库-Data Vault模型
Data Vault模型简介
一种数据仓库建模方法,用于存储来自多个操作型系统的完整的历史数据。每个数据行都包含数据来源和装载时间属性,用以审计和跟踪数据值所对应的源系统。
Data Vault(DV)模型用于企业级的数据仓库建模,是Dan Linstedt在20世纪90年代提出的。在最近几年,获得很多关注。
定义如下
面向细节的,可追溯历史的,一组有连接关系的规范化的表的集合。
他是综合了第三范式和星型模型优点的建模方法。
其设计理念是满足企业对灵活性、可扩展性、一致性和对需求的适应性的要求,是一种专为企业级数据仓库量身定制的建模方式。
Data Vault模型的组成部分
data Vault模型有中心表(Hub)、链接表(Link)、附属表(Satellite)三个主要组成部分。
中心表记录业务主键,链接表记录业务关系,附属表记录业务描述。
中心表
保存一个组织内每个实体的业务主键。
中心表和源系统表是互相独立的。
中心表属性
主键
业务主键
装载时间
数据来源
链接表
是中心表之间的链接。
一个链接表意味着两个或多个中心表之间有关联。
链接表属性
主键
外键
装载时间
数据来源
附属表
用来保存中心表和链接表的属性
包含所有的历史变化数据
一个附属表总有且唯一一个外键引用到中心表或链接表
附属表属性
主键
外键
装载时间
失效时间
数据来源
属性
Data vault模型的特点
- 所有数据都基于