sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具。
导入数据:MySQL,Oracle导入数据到Hadoop的HDFS、HIVE、HBASE等数据存储系统;
导出数据:从Hadoop的文件系统中导出数据到关系数据库
CDH先安装了Sqoop2,以为用法一样,只是结构不一样了,后来发现用法完全不一样,又把sqoop给装了回来,还复习了一波
hadoop1 是我的Mysql安装机器
exercise Mysql中测试的的数据库
test_table Mysql exercise数据库的测试表
文章目录
选项 | 含义说明 |
---|---|
–append | 将数据追加到HDFS上一个已存在的数据集上 |
–as-avrodatafile | 将数据导入到Avro数据文件 |
–as-sequencefile | 将数据导入到SequenceFile |
–as-textfile | 将数据导入到普通文本文件(默认) |
–boundary-query | 边界查询,用于创建分片(InputSplit) |
–columns <col,col,col…> | 从表中导出指定的一组列的数据 |
—delete-target-dir | 如果指定目录存在,则先删除掉 |
–direct | 使用直接导入模式(优化导入速度) |