基于apache ambari 的大数据平台搭建并运行WordCount

本文介绍了如何在3台RHEL 6.4虚拟机上搭建基于Apache Ambari的大数据平台,包括配置DNS、安装http服务、传输和解压软件包、设置SSH免密登录、安装NTP、关闭防火墙和SELinux,以及安装Ambari Server。在Ambari上选择了HDFS和MapReduce服务进行部署,并演示了运行WordCount示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

操作系统:3个 rhel 6.4,内存2g,动态硬盘20g。
虚拟机软件:virtualBox

注意:
1、yum可能要重新安装,可百度解决
1、确保三个host能互相ping通

每个host配置DNS

vi /etc/hosts

这里写图片描述

为host4安装http服务

yum install httpd

这里写图片描述

用Xftp4软件连接host4的文件系统

这里写图片描述

连接成功后显示

这里写图片描述

进入目录/var/www/html

这里写图片描述

将三个压缩包从windows传到host4的上面那个目录里,分别是:
HDP:HDP-2.6.0.3-centos6-rpm.tar.gz
HDP-UTILS:HDP-UTILS-1.1.0.21-centos6.tar.gz
Ambari 2.5.0 :ambari-2.5.0.3-centos6.tar.gz

这里写图片描述

解压

tar -zxvf ambari-2.5.0.3-centos6.tar.gz
tar -zxvf HDP-2.6.0.3-centos6-rpm.tar.gz
tar -zxvf HDP-UTILS-1.1.0.21-centos6.tar.gz

解压时注意空间不够的问题,最好先解压大的文件,解压完删除对应的压缩文件。

启动http服务

这里写图片描述

在浏览器上输入10.132.102.71/ambari/

这里写图片描述

在浏览器上输入http://10.132.102.71/HDP/centos6/

这里写图片描述

在浏览器上输入http://10.132.102.71/HDP-UTILS-1.1.0.21/

这里写图片描述

接下来配置host1到其它host能root免密码登录。

为每个host 执行

ssh-keygen
cd .ssh
touch authorized_keys

host1 执行

cat id_rsa.pub >> authorized_keys

把host1的authorized_keys拷贝到其它host的.ssh下

scp authorized_keys root@host2:~/.ssh
scp authorized_keys root@host4:~/.ssh

更改目录和文件的权限,每个host执行

chmod 700 ~/.ssh
chmod 600 ~/.ssh/authorized_keys

每个host安装ntp

yum install -y ntp

设置ntp开机自启动

chkconfig ntpd on

启动ntp

service ntpd start

关闭防火墙

chkconfig iptables off

disable SELinux

setenforce 0

Setting the umask for your current login session:

umask 0022

Checking your current umask:

umask 0022

Permanently changing the umask for all interactive users:

echo umask 0022 >> /etc/profile

每个host下载ambari.repo
地址:
http://public-repo-1.hortonworks.com/ambari/centos6/2.x/updates/2.5.0.3/ambari.repo

按如下进行修改

并将文件放到/etc/yum.repos.d/下

cp ambari.repo /etc/yum.repos.d/

执行

cat /sys/kernel/mm/transparent_hugepage/enabled

这里写图片描述

若中括号在always两侧,自行百度“如何将Transparent HugePages关闭”解决

选择host1安装ambari服务器

yum install ambari-server

这里写图片描述

将jdk-8u112-linux-x64.tar.gz放到/var/lib/ambari-server/resources/目录下,否则自动下载Java时会很慢。

ambari-server setup

这里写图片描述

setup第一次可能会失败,我试了三次就成功了。

启动ambari服务器

ambari-server start

这里写图片描述

在浏览器中输入10.132.102.61:8080
这里写图片描述

用户名和密码都是admin

这里写图片描述

点击Launch Install Wizard,随便起个名字

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

复制host1的私钥(id_rsa)到下面的编辑框

这里写图片描述

注册认证

这里写图片描述

由于内存不够,这里只示范两个host

这里写图片描述

这里写图片描述

注意检查红框里的警告
如没有警告,Next。

这里写图片描述

此处只选择HDFS和MapReduce服务,Next。

这里写图片描述

Next

这里写图片描述

DataNode都打钩,next

这里写图片描述

红色的数字都是要求设置密码的,设置好后next

这里写图片描述

Deploy

这里写图片描述

这里写图片描述

到这里,部署成功了,增加删除结点和服务都可以在此基础上操作。

接下来运行wordcount自带例程
自己在本地创建好word_test.txt,并通过copyfromlocal复制到hdfs下。

hadoop fs -cat /tmp/input/word_test.txt

这里写图片描述

sudo -u hdfs hadoop jar /usr/hdp/2.6.0.3-8/hadoop-mapreduce/hadoop-mapreduce-examples-2.7.3.2.6.0.3-8.jar wordcount /tmp/input/word_test.txt /tmp/output

这里写图片描述

这里写图片描述

hadoop fs -ls /tmp/output

这里写图片描述

hadoop fs -cat /tmp/output/part-r-00000

这里写图片描述

结束。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值