（超详细）Spark on Yarn安装配置

奈奈聊成长

已于 2024-05-21 20:57:55 修改

阅读量2.1k

点赞数 6

CC 4.0 BY-SA版权

分类专栏：大数据比赛-全国职业院校技能大赛数据分析文章标签： spark 大数据分布式

于 2024-01-07 11:54:46 首次发布

本文链接：https://blog.csdn.net/m0_67447926/article/details/135437696

数据分析同时被 2 个专栏收录

22 篇文章 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

大数据比赛-全国职业院校技能大赛

15 篇文章 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

本文详述了如何在已安装Hadoop的基础上，以root用户身份进行Spark on Yarn的安装配置，包括Spark的上传解压、环境变量设置、spark-env.sh文件修改，以及通过运行计算Pi的jar包来验证安装。特别提示，若遇到内存错误，需调整yarn-site.xml中的虚拟内存配置，确保其为物理内存的4倍。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1，前期准备

使用 root 用户完成相关配置，已安装配置Hadoop 及前置环境

2，spark上传解压到master服务器

3，修改环境变量

/etc/profile末尾添加下面代码

export SPARK_HOME=.../spark-3.1.1-bin-hadoop3.2(注意：需要替换成你自己得路径)
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

4，环境变量生效

source /etc/profile

5，运行spark-submit --version

显示如下

6，修改saprk-env.sh文件

在.../spark-3.1.1-bin-hadoop3.2/conf目录下，将下面两行添加至spark-env.sh文件末尾：

HADOOP_CONF_DIR=.../hadoop-3.1.3/etc/hadoop
YARN_CONF_DIR=.../hadoop-3.1.3/etc/hadoop

7，运行计算Pi的jar包

命令如

了解本专栏

订阅专栏解锁全文

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

奈奈聊成长

关注关注

6
点赞
踩
24

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

订阅专栏

spark on yarn模式安装部署

xiaozhaoshigedasb的博客

12-24

1154

配置spark之前，请自行部署Hadoop2.7.2，JDK1.8，ssh免密码登录等准备工作。 1）修改hadoop配置文件yarn-site.xml,添加如下内容： [root@mzz11 opt]$ vi yarn-site.xml <property> <name>yarn.nodemanager.pmem-check-enable...

spark on yarn配置安装

qq_65303368的博客

02-13

923

配置环境变量，在/etc/profile文件中添加以下内容并重新加载配置文件(source /etc/profile)进入spark/conf配置目录新建spark-env.sh文件(vim spark-env.sh)并加入以下内容。将下载好的压缩包传入虚拟机的安装路径，本文章为/soft目录。进入spark安装目录输入以下内容成功返回pi的值则配置成功。

1 条评论您还未登录，请先登录后发表或查看评论

Spark on YARN安装

Maqiuqiu520的博客

10-24

603

Spark on YARN安装 1.安装Scala (1)首先解压scala: tar -zxvf scala安装包 (2)修改环境变量: vim /etc/profile 内容如下： export SCALA_HOME=/usr/scala/scala-2.11.12 export PATH=$SCALA_HOME/bin:$PATH (3）生效环境变量： source /etc/prof...

Spark on YARN部署与配置指南

热门推荐

GG Bond 的博客

09-15

1万+

Spark on YARN 部署搭建详细图文教程

Spark on Yarn安装配置

weixin_44794485的博客

01-22

2156

步骤1：复制和解压Spark安装包解压文件：将Spark安装包解压到/opt/module目录中。

【Spark】Spark On Yarn 安装

w1992wishes的博客

11-14

999

文章目录一、下载和解压二、配置2.1、配置 spark-default.conf，按需调整2.2、配置 spark-env.sh2.3、配置 slaves2.4、创建目录2.5、拷贝到其他节点2.6、配置环境变量三、启动与测试3.1、启动 Standalone 模式3.2、启动 spark 的 history-server3.3、测试 Yarn 模式一、下载和解压 https://archiv...

摸鱼大数据——Spark基础——Spark On Yarn环境配置和部署

weixin_65694308的博客

07-02

2386

export/data/spark_project/spark_base/05_词频统计案例_spark_on_yarn运行.py。/export/data/spark_project/spark_base/05_词频统计案例_spark_on_yarn运行.py。/export/data/spark_project/spark_base/05_词频统计案例_spark_on_yarn运行.py。相比原理hadoop集群,需要多启动一个spark的自己的历史服务,它是依赖hadoop的历史服务的!

Spark实验：On Yarn模式安装部署（带答案）1

08-03

总结来说，Spark on Yarn的安装部署涉及到多个环节，包括环境配置、资源管理器的设置、集群启动以及应用的提交和监控。每个步骤都需要仔细操作，以确保Spark能够有效地在Hadoop集群上运行。通过这个实验，不仅可以...

Spark On YARN环境配置

feizuiku0116的博客

02-06

3258

一、准备工作点击查看Spark Standalone HA环境配置教程二、修改配置文件一、修改spark-env.sh cd /export/server/spark/conf vim /export/server/spark/conf/spark-env.sh # 添加以下内容 HADOOP_CONF_DIR=/export/server/hadoop-3.3.0/etc/hadoop/ YARN_CONF_DIR=/export/server/hadoop-3.3.0/etc/hadoop/

GZ033 大数据应用开发赛题第01套--子任务二：Spark on Yarn安装配置

weixin_44117248的博客

05-08

611

2023年全国职业院校技能大赛赛题第01套--任务A：大数据平台搭建（容器环境）（15分）--子任务二：Spark on Yarn安装配置

Spark on YARN 模式安装配置指南

2301_80214672的博客

04-19

669

方法2：如果没有安装包但已有Standalone安装，可以直接复制现有目录。# Spark on YARN cluster模式执行SparkPi示例。# Spark on YARN client模式执行SparkPi示例。# 如果已经有Standalone模式的安装，需要另外复制一份。# 将配置好的Spark分发到slave1和slave2节点。# 将更新后的环境变量分发到slave1和slave2节点。# 在slave1和slave2上刷新环境变量。# 启动Hadoop历史服务器（如果尚未启动）

Spark on yarn 环境简单安装配置，python代码提交测试

a1314_521a的博客

07-15

1471

使用云服务器搭建hadoop集群，hadoop、yarn和spark配置文件设置，spark on yarn 环境搭建，python任务提交测试，spark-submit提交python任务测试，及其spark-submit提交参数详解

4、安装部署Spark(Spark on Yarn模式)

Manonll的博客

06-15

4679

执行ls -l命令会看到下面的图片所示内容，这些内容是Spark包含的文件： 4.2.1.2在文件末尾添加如下内容；保存、退出 4.2.1.3重新编译文件，使环境变量生效 4.3验证Spark安装 4.3.1修改${HADOOP_HOME}/etc/Hadoop/yarn-site.xml；说明：在master和slave01、slave02节点都要如此修改此文件 4.4重启hadoop集群（使配置生效） 4.5进入Spark安装主目录 4.5.1执行下面的命令（注意这是1行代码）： 4.5

java spark on yarn_Spark on Yarn 安装配置

weixin_39864373的博客

02-24

334

1、说明这篇文章是在xxx基础上进行部署的，需要hadoop的相关配置和依赖等等，Spark on Yarn的模式，Spark安装配置好即可，在Yarn集群的所有节点安装并同步配置，在无需启动服务，没有master、slave之分，Spark提交任务给Yarn，由ResourceManager做任务调度。2、安装yum-yinstallspark-corespark-netlibspar...

Spark on Yarn安装配置,大数据技能竞赛（容器环境）

weixin_62687791的博客

12-05

2397

Spark on Yarn模式，即把Spark作为一个客户端，将作业提交给Yarn服务，由于在生产环境中，很多时候都要与Hadoop使用同一个集群，因此采用Yarn来管理资源调度，可以有效提高资源利用率。服务端登录地址详见各任务服务端说明。补充说明：宿主机可通过Asbru工具或SSH客户端进行SSH访问；相关软件安装包在宿主机的/opt目录下，请选择对应的安装包进行安装，用不到的可忽略；所有任务中应用命令必须采用绝对路径；进入Master节点的方式为进入Slave1节点的方式为。

Spark on Yarn 安装配置

weixin_33912246的博客

05-12

164

【Spark】on Yarn 模式安装配置

瘦熊的博客

06-12

8712

在安装spark前先安装scala 下载Scala 上传到/opt/modules/softwares目录并解压到/opt/modules目录下 root@master:/opt/softwares# ll total 745404 drwxr-xr-x 2 root root 4096 6月 12 17:08 ./ drwxr-xr-x 7 root root 4096 6...

Spark on Yarn安装配置黑马

03-15

<think>好的，我需要帮用户查找关于Spark on Yarn的安装与配置教程，特别是黑马程序员的资料。首先，用户提供的引用中，引用[^1]提到黑马程序员的Spark教程，可能包含相关内容。但问题在于用户提供的链接是否直接对应到Spark on Yarn的配置部分。我需要先检查引用内容。引用[^1]是Spark教程，但描述中只提到4天快速入门，可能涵盖基础内容，但不确定是否包含Spark on Yarn的具体配置步骤。用户可能需要更详细的步骤，比如环境变量设置、配置文件修改等。接下来，引用[^2]是Hadoop的下载地址，而Spark on Yarn需要Hadoop环境，所以可能需要指导用户安装Hadoop 3.3.0，并配置Yarn。引用[^3]是下载工具，可能对用户下载所需软件有帮助，但不太相关于安装配置本身。用户可能需要的步骤包括：1. 确保Hadoop（Yarn）已正确安装；2. 下载并解压Spark；3. 配置Spark的环境变量和配置文件（如spark-env.sh）；4. 测试Spark on Yarn模式。需要确认黑马程序员的教程中是否有这些步骤。由于引用的教程是基于Python的，可能涉及PySpark的配置，需要注意相关细节。另外，可能需要引导用户参考官方文档作为补充，因为第三方教程可能步骤不全。用户可能遇到的常见问题包括环境变量配置错误、Yarn资源管理配置不当，或者Spark与Hadoop版本不兼容。因此，在回答中应提醒注意版本匹配，例如Spark 3.2与Hadoop 3.3.0的兼容性。最后，需要确保回答结构清晰，分步骤说明，并引用提供的参考资料，特别是黑马程序员的教程和Hadoop的下载链接。如果教程中没有详细步骤，建议用户查阅官方文档或提供额外资源链接。</think>以下是根据黑马程序员Spark教程整理的Spark on Yarn安装配置步骤： ### 一、环境准备 1. 已安装Hadoop 3.3.0集群（下载地址见引用） 2. 下载Spark 3.2版本（需与Hadoop版本匹配） 3. 确保YARN_RESOURCEMANAGER_USER环境变量已配置 ### 二、核心配置步骤 1. 解压Spark安装包并配置环境变量 ```bash export SPARK_HOME=/opt/spark-3.2.0-bin-hadoop3.2 export PATH=$PATH:$SPARK_HOME/bin ``` 2. 修改`spark-env.sh`配置文件 ```bash cp $SPARK_HOME/conf/spark-env.sh.template $SPARK_HOME/conf/spark-env.sh echo "export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop" >> spark-env.sh echo "export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop" >> spark-env.sh ``` 3. 配置`spark-defaults.conf` ```properties spark.master yarn spark.eventLog.enabled true spark.eventLog.dir hdfs://namenode:8020/spark-logs ``` ### 三、验证部署执行测试任务： ```bash spark-submit --class org.apache.spark.examples.SparkPi \ --master yarn \ --deploy-mode cluster \ $SPARK_HOME/examples/jars/spark-examples_2.12-3.2.0.jar 10 ```