
大数据项目实战案例

大数据项目实战案例
实战
集群启动与关闭
集群监控
文件操作:
实战 :文件上传
实战 :文件下载
实战 :文件移动、复制、删除
运行任务:
实例 :单词计数
实例 : 单词过滤计数
实例 :示例程序总览
实战
启动
实战
) 新建文件夹
) 上传数据 (默认数据在 目录)
) 改变目录
) 查看文件内容
) 加载数据
) 过滤 数据
) 分组数据
) 数据保存
) 查看数据
) 查看任务监控
实战
命令
实例
实例 : ! 聚类算法
) 上传数据
) 数据转换
) 数据转换查看
) 调用 ! 算法
) 查看结果
) 格式化输出
) 日志监控:
实例 :随机森林分类算法
) 数据上传:
) 生成描述文件:
) 查看生成的描述文件:
) 训练并生成随机森林模型"
) 查看模型:

) 测试生成的随机森林模型:
) 查看日志:
# 实战
# 启动
# 实战
) 数据上传
) 创建 # 表
) 导入数据
) 查询
$%& 实战
$%& 启动
) 确保没有 相关进行运行
) 进入 $%& 目录,启动 $%& 集群
) 查看相关监控
$%& 交互式
) 确保 $%& 集群启动
) 启动 $%& 交互式程序:
) 单词计数程序实战
) 查看结果
$%& 命令行
案例实战

1. Hadoop 实战
1. 集群启动与关闭
终端进入目录,执行启动命令:
'
(%) '*+!, !%'-!!
(%) '*+!, !%'.% !
(%) '*+!, %'/,!%.' !!%!%.!%#%
终端进入目录,执行关闭命令
'
(%) '*+!, !%'.% !
(%) '*+!, !%'-!!
(%) '*+!, %'/,!%.' !!!%.!%#%