
spark
文章平均质量分 92
apprentices
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Spark SQL With Join
Spark SQL With Join 本文主要是讲解spark中DataFrame 和SparkSQL的综合使用,以join操作为例。示例代码都是使用java和scala语言编写的。 java版本 package com.dt.sparkql.java; import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD; import org.apache.spark.api.java.Java..原创 2020-10-08 10:55:38 · 699 阅读 · 0 评论 -
spark第一阶段总结
注:小学徒从9月1号开始学习scala语言和spark分布式大数据计算框架,现对半个月的学习做出总结,初次了解,多有不足之处,还望各路高手多多指点。 Spark是一个基于内存(优先考虑内存,也可基于磁盘)、擅长进行迭代计算、多数据源的分布式大数据实时计算框架。应用程序提交之后,运行在多台机器上,每台机器各负责处理一部分数据,并行计算,最终进行汇总输出。 多数据源:1.使用程序集合创建RDD 2.使用本地文件系统 3.使用hd...原创 2020-09-15 11:21:25 · 216 阅读 · 0 评论