Hadoop
Linux -> Hadoop -> HBase -> Spark
Hadoop分布式计算基础是什么?
1、存储
2、计算
电影评分数据统计分析实验
【项目目标】
1)掌握Hive的查询语句的使用
2)掌握R的可视化分析
【实验原理】
一、Hive支持多种不同长度的整型和浮点型数据类型,支持布尔类型,也支持无长度限制的字符串类型。
二、查询语句是所有数据库都包括的,并且很常用,所以需要熟练掌握。
三、R中的可视化非常漂亮,我们需要熟练使用。
【实验环境】
CentOS6.5、JDK1.7、Hadoop2.4.1、Hive0.12.0、R-3.2.2
【实验数据】
hot_movie
字段 | 定义 |
---|---|
m_id | (电影id) |
score | (系统评分) |
m_name | (电影名称) |
user_movie
字段 | 定义 |
---|---|
u_name | (用户昵称) |
m_id | (电影id) |
u_score | (用户 |