pig入门 基本的Hello-world

本文详细介绍了Pig数据处理框架的使用方法,包括本地交互和集群MapReduce两种方式。通过示例展示了如何使用Pig Latin语法加载数据、执行转换操作及输出结果,适用于大数据处理的开发与应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、pig能够使用很多种方式,本地交互方式和集群mapreduce方式等。具体可以在官网上查看,网址:http://pig.apache.org/docs/r0.17.0/start.html

 

2、我们先使用本地文件方式。这种方式一般是在开发的时候使用的,因为开发的时候需要速度快一些,使用一小部分数据进行验证即可。开发完成后可以使用mapreduce方式。

 

交互方式本地 pig -x local

A = load '/root/xytest/bb.txt' using PigStorage(':');

B = foreach A generate $0 as id;

dump B;

 

输出结果:

(root)

(bin)

(daemon)

(adm)

(lp)

(sync)

(shutdown)

(halt)

(mail)

(operator)

(games)

(ftp)

(nobody)

(avahi-autoipd)

(systemd-bus-proxy)

(systemd-network)

(dbus)

(polkitd)

(tss)

 

 

脚本方式:

id.pig

A = load '/root/xytest/bb.txt' using PigStorage(':');

B = foreach A generate $0 as id;

dump B;

 

运行脚本:

pig -x local id.pig

 

 

下面是使用mapreduce的方式,这种方式加载文件的时候需要让文件在hdfs中

可以用 hdfs dfs -ls 查看文件情况。

交互方式的时候使用pig即可。

运行脚本的时候使用pig id.pig即可。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值