数仓及其维度(分层)建模(ODS DWD DWS DWT ADS)

ForwardSummer

已于 2023-01-05 21:04:30 修改

阅读量1.3w

点赞数 16

CC 4.0 BY-SA版权

分类专栏：大数据文章标签：数据仓库

于 2022-05-12 21:55:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45532984/article/details/124731837

本文介绍了数据仓库及其维度建模，阐述了数仓的特点如集成性、稳定性、动态性、主题性和扩展性。数仓分层包括ODS（原始数据层）、DWD（数据清洗层）、DWS（数据汇总层）、DWT（数据主题层）和ADS（应用数据层），各层的作用和数据处理过程，强调了分层对于减少重复开发、清晰数据结构、定位问题和简化复杂问题的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一. 数仓及其维度

1. 什么是数仓？

数据仓库，简称数仓,（ Data Warehouse ）。从逻辑上理解，数据库和数仓没有区别，都是通过数据库软件实现存放数据的地方，只不过从数据量来说，数据仓库要比数据库更庞大。

数仓主要是为企业制定决策，提供数据支持的。当业务简单，可以用数据库来存储，分析，制表。但当数据量几何式增长，需要跨机器整合时，数仓就是非常必要的了。

2. 数仓的特点

（1）集成性

数仓中存储的数据来源于多个数据源，原始数据在不同数据源中的存储方式各不相同。要整合成为最终的数据集合，需要从数据源经过一系列抽取、清洗、转换的过程。

（2）稳定性

数仓中保存的数据是历史记录，不允许被修改。用户只能通过分析工具进行查询和分析。

（3）动态性

数仓的数据会随时间变化而定期更新，这里的定期更新不是指修改数据，一般是将业务系统发生变化的数据定期同步到数仓，和稳定性不冲突。不可更新是针对应用而言，即用户分析处理时不更新数据

（4）主题性

传统数据库对应的业务不同，数仓需要根据需求，将不同数据源的数据进行整合，即数据一般都围绕某一业务主题进行建模。例如“贷款”主题、“存款”主题等。

（5）扩展性

之所以有的大型数据仓库系统架构设计复杂，是因为考虑到了未来3-5年的扩展性，这样的话，未来不用太快花钱去重建数据仓库系统，就能很稳定运行。主要体现在数据建模的合理性，数据仓库方案中多出一些中间层，使海量数据流有足够的缓冲，不至于数据量大很多，就运行不起来了。

3. 数仓的数据哪里来？

（1）业务数据

就是各行业在

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。