hive-insert

notice

hive不像mysql、oracle这些数据库一样在insert的时候可以指定字段,必须在插入的时候插入的是全字段。

少一个也不行,只会按建表语句顺序匹配值。

在select中指定别名也不行。

这样也不行

insert overwrite table my.test_table partition(pt=1) select 2 as col2, 1 as col1

add column之后,在旧分区插入的新字段的数据查不到,显示为null。add column之后的新分区可以。

这是因为你对表结构进行了改变,但是历史分区的数据却没有做改变(新增分区不会出现这个情况)。

为了解决上面的问题,可以采用两种方式:

如果已经执行添加操作,并且没有带cascade,可以尝试下面的方法:
使用replace 恢复表结构,这样历史的分区数据都不会消失

alter table industry_db.product replace columns
(product_name string comment ‘产品名’);

在新增的时候加上cascade关键词

alter table my.test_table add columns(col3 int comment '第三列') cascade

一、直接将文件insert到本地或hdfs上

1.insert到本地,谁的本地?sql提交到的地方的本地,就是metastore或者hs2

INSERT OVERWRITE LOCAL DIRECTORY '路径'
ROW FORMAT DELIMITED FIELDS TERMINATED by ',' 
select * from datas;

2.insert到hdfs,这里分隔符的设置有些迷,比如@@##会变成@

INSERT OVERWRITE DIRECTORY '路径'
ROW FORMAT DELIMITED FIELDS TERMINATED by '@@##'
select * from datas;
04-24
### Hive `-e` 参数的用法 Hive 提供了一个命令行工具,允许用户通过 `hive -e` 执行单条 SQL 查询或者一系列查询语句。此参数主要用于运行简单的 HiveQL 脚本或命令。 #### 语法 ```bash hive -e "SQL_QUERY" ``` 其中 `"SQL_QUERY"` 是要执行的具体 HiveQL 语句。如果需要执行多个查询,则可以将它们连接在一起并用分号 (`;`) 隔开[^1]。 #### 示例 以下是几个常见的使用场景: 1. **执行简单查询** 如果只想查看某个表的内容,可以直接写一条 SELECT 语句: ```bash hive -e "SELECT * FROM employees LIMIT 10;" ``` 2. **创建表并加载数据** 可以一次性完成建表和加载数据的操作: ```bash hive -e " CREATE TABLE IF NOT EXISTS employee ( id INT, name STRING, salary DOUBLE ); LOAD DATA INPATH '/data/employee.txt' INTO TABLE employee; " ``` 3. **处理特殊字符** 当 SQL 中包含单引号时,需注意转义问题。例如插入含有单引号的数据时,可采用 PostgreSQL 类似的解决办法[^2]: ```bash hive -e "INSERT INTO table_name VALUES ('<html><script>let a=''a''</script></html>');" ``` 或者使用反斜杠进行转义: ```bash hive -e "INSERT INTO table_name VALUES ('<html><script>let a=\\'a\\'</script></html>');" ``` 4. **导出查询结果到文件** 结合重定向功能,可以将查询结果保存至本地文件: ```bash hive -e "SELECT * FROM sales;" > output.csv ``` 5. **调优配置** 在某些情况下可能需要调整 MapReduce 的行为,比如设置 Reduce 数量来优化性能。可以通过 `SET` 命令实现这一点: ```bash hive -e " SET mapred.reduce.tasks=-1; SELECT COUNT(*) FROM large_table WHERE condition='value'; " ``` ### 注意事项 - 若涉及复杂逻辑建议编写独立 `.hql` 文件并通过 `-f` 参数提交。 - 对于大规模作业应考虑资源分配合理性和集群负载情况[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值