文章目录
- Logistics_Day10:主题及指标开发
-
- 01-[复习]-上次课程内容回顾
- 02-[理解]-第6章:内容概述和学习目标
- 03-[了解]-第10天:课程内容提纲
- 04-[理解]-主题及指标开发之功能总述
- 05-[掌握]-主题及指标开发之数仓分层架构
- 06-[掌握]-主题及指标开发之三层架构流程
- 07-[掌握]-主题及指标开发之离线模块初始化
- 08-[掌握]-主题及指标开发之公共接口【结构】
- 09-[掌握]-主题及指标开发之公共接口【编程】
- 10-[理解]-快递单主题之数据调研及业务分析
- 11-[掌握]-快递单主题之数据拉宽【MAIN 方法】
- 12-[掌握]-快递单主题之数据拉宽【process 方法】
- 13-[掌握]-快递单主题之指标计算【MAIN 方法】
- 14-[掌握]-快递单主题之指标计算【process 方法】
- 15-[掌握]-快递单主题之指标计算【转换DataFrame】
Logistics_Day10:主题及指标开发
01-[复习]-上次课程内容回顾
主要讲解:实时ETL转换开发,编写结构化流(StructuredStreaming)程序,实时从Kafka消费数据,进行ETL转换处理,最终保存到Kudu存储引擎(表中)。
从分布式消息队列Kafka中消费数据,每个业务系统业务数据存储在1个Topic中。
- 1)、加载数据:
load
方法,从Kafka中实时消费数据