- 博客(11)
- 收藏
- 关注
原创 Spark_04 SparkSQL的介绍及使用
这一章主要包括对于sparksql概念的介绍,sparksql的特点,sparksql用到的数据类型,DataFrame的基础方法等。
2024-07-01 20:35:53
911
原创 Spark_03 RDD专题_02
本章主要继续对RDD进行介绍,主要内容有缓存机制,checkpoint机制,spark的运行流程,spark的shuffle过程,spark并行度等部分。
2024-06-29 23:02:41
1071
原创 Spark_01 spark的基本概念
说明:该章节讲述spark的理论概念和简单的操作,这部分我们只需要做到明确概念就行,把学习重心放在后面的方法掌握和应用。
2024-06-27 20:37:58
1604
1
原创 大数据基础篇_02
本章内容主要是对hive的概念与使用做一个简述(之后一章会有更详细的介绍),mapreduce执行流程的介绍,Yarn的执行流程的介绍及Zookeeper的相关介绍
2024-06-22 17:55:20
2844
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人