Hive学习之数据加载

最新推荐文章于 2022-12-13 18:05:07 发布

五角耒

最新推荐文章于 2022-12-13 18:05:07 发布

阅读量391

点赞数

CC 4.0 BY-SA版权

分类专栏： Hive

本文链接：https://blog.csdn.net/YoungChiu2016/article/details/102486839

Hive 专栏收录该内容

2 篇文章

订阅专栏

#Hive数据加载

LOAD DATA LOCAL INPATH  'test_data'
[OVERWRITE] INTO TABLE test PARTITION(day='20191005');

但有时数据文件很大，需要将大文件分解

split -a 2 -d -l 1000000 test_data test_data_split_

会得到几个以“test_data_split_”开头的文件。其中“-a 2 d” 表示后缀是两位的整数，“-l 1000000” 表示以每1000000行分隔文件，比如得到
test_data_split_00等等
这时我们需要一个一个加载（好麻烦，暂时没找到快捷方式）

LOAD DATA LOCAL INPATH  'test_data_split_00'
INTO TABLE test PARTITION(day='20191005');

注意，不要加“OVERWRITE”，当然，手欠，加了几次，发现可以找回的

查看最近一次删除的文件
hadoop fs -ls /user/hadoop/.Trash/Current/user/hive/warehouse/myhive.db/file_folder
下载到当前路径
hadoop fs -get /user/hadoop/.Trash/Current/user/hive/warehouse/myhive.db/file_folder

如果不想使用直接hive，我们可以间接地通过hadoop fs shell命令实现（当前路径的文件）数据加载，注意这里的数据应符合HDFS文件要求，一般是“|”分隔，至于“,”是否可行，可以一试。

hadoop fs -put filename /user/hive/warehouse/myhive.db/test/

不同的是，这里的“filename” 可以是多个。
更多hadoop fs shell 可参考官方文档。
中文版hadoop 1.0.4
英文版hadoop 2.7.7
。。。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

五角耒

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

hive加载数据的几种方式

程老师的博客

06-09

2113

1.从文件中加载数据建表语句： hive> CREATE TABLE IF NOT EXISTS `test.test7`( > `user_id` int, > `name` string, > `address` string) > row format delimited > fields terminated by ','; OK Time taken: 0.055 seconds 注意：建表的分隔符必须

4、Hive数据仓库——加载数据

hujieliang123的博客

02-20

2596

Hive数据仓库——加载数据

1 条评论您还未登录，请先登录后发表或查看评论

hive数据加载

bear

05-09

3077

hive数据导入的几种格式。包括load data、查询语句导入、动态语句导入、CTAS格式数据导入。

Hive SQL使用和数据加载的一点总结

weixin_33712881的博客

02-17

302

Hive 是facebook开源的一个基于hadoop框架的查询工具，也就是说，需要用hive的话，就要先安装hadoop。这次是小结一下最近用hive的心得，经验分享。hadoop和hive，pig，hbase的安装配置以后专门另开个连载说比较好。所以，我假设你已经有hive了。1.字段的数据类型。hive实际上为了数据挖掘的需要，对hive表的字段设置了数据类型，对于经常where的，还可以设...

hive数据仓库课后答案

qq_56694838的博客

12-13

1万+

Hive数据仓库应用课后答案

创建hive表和使用Load data指令导入数据的注意事项

热门推荐

helloxiaozhe的博客

11-04

7万+

创建hive表和使用Load data指令导入数据的注意事项（一）创建hive数据库和表1.1 类似于MySql创建命令，创建数据库和表，并指定它在hdfs上的存储数据的目录'/hive_hdfs_local_data‘hive> CREATE DATABASE yyz_workdb; hive> create external table test_user( > us...

基于Hadoop的数据仓库Hive学习指南.doc

04-06

【标题】：“基于Hadoop的数据仓库Hive学习指南” 【描述】：该文档是一份针对Hive的学习资料，旨在引导读者理解如何在Hadoop平台上利用Hive进行数据仓库操作和编程实践。它涵盖了Hive的基本概念、安装步骤、实验...

hadoop Hive学习配套数据

04-01

Hadoop Hive学习配套数据是大数据领域中非常关键的一部分，它主要服务于那些想要深入理解Hive在Hadoop生态系统中如何操作和分析大规模数据的学者和从业者。Hive是Apache软件基金会开发的一个数据仓库工具，它允许...

用于Hive学习的数据

01-08

标题 "用于Hive学习的数据" 暗示了这是一个与Hadoop Hive相关的学习资源，它提供了实际的数据集供用户进行数据分析和练习。Hive是一个基于Hadoop的数据仓库工具，能够将结构化的数据文件映射为一张数据库表，并提供...

Hive加载离线数据教程

02-13

学习到Hive的表格设计理论，数据导入教程

Hive - Load Data 数据过长或过短

BITDDD小栈

12-03

1647

Hive 可以通过load data inpath 加载本地或者 hdfs 的数据到 hive 表中，有时会出现生成数据长于 hive 表字段或者短于 hive 表字段的情况，经过测试，两种情况下 Load Data 到 hive 表中均没有问题。

Hive（八）Hive的Shell操作与压缩存储

weixin_42073629的博客

09-23

494

一、Hive的命令行 1、Hive支持的一些命令 Command Description quitUse quit or exit to leave the interactive shell. set key=valueUse this to set value of particular configuration variable. One thing to note here is that if you misspell the variable name, cli will not..

mysql load into table,MySQL使用LOAD DATA导入数据及注意事项

weixin_29221753的博客

03-17

1248

LOAD DATA语法：LOAD DATA [LOW_PRIORITY | CONCURRENT] [LOCAL] INFILE ‘file_name’[REPLACE | IGNORE]INTO TABLE tbl_name[CHARACTER SET charset_name][{FIELDS | COLUMNS}[TERMINATED BY ‘string’][[OPTIONALLY] EN...

LOAD DATA INFILE语句导入数据进入MySQL的一些注意事项

myslq的博客

09-02

1万+

可以用以下语句导入CSV或其他格式数据进入MySQL数据库，LOAD DATA LOCAL INFILE "C:\\wamp\\apps\\litigationinfo.csv" REPLACE INTO TABLE litigationinfo CHARACTER SET utf8 FIELDS TERMINATED BY "," ENCLOSED BY "" LINES TERMINA

spring-context-4.1.2.RELEASE.jar中文文档.zip

08-24

1、压缩文件中包含：中文文档、jar包下载地址、Maven依赖、Gradle依赖、源代码下载地址。 2、使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 3、特殊说明：（1）本文档为人性化翻译，精心制作，请放心使用；（2）只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等；（3）不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 4、温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件。 5、本文件关键字： jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册。

python39-rpm-4.14.3-32.1.el8.tar.gz

08-24

# 适用操作系统：Centos8 #Step1、解压 tar -zxvf xxx.el8.tar.gz #Step2、进入解压后的目录，执行安装 sudo rpm -ivh *.rpm

基于分层直接绘制思想的C-Direct-UI界面库-借鉴WPF和Unity3D-UGUI原理-包含报表设计展示打印功能-支持复杂表格与可变数据长度自适应布局-底层算法实现表格框架.zip