impala、hive之parquet表性能测试

本文通过实际案例对比了Impala与Hive在建表及查询性能上的表现。使用相同的数据量进行测试,Impala在建表耗时上明显优于Hive;而在查询性能方面,虽然未给出具体数据,但可以推测Impala同样具有优势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前提条件说明:impala已打通hive元数据,测试表格式为parquet

建表性能测试

一、impala
建表SQL

create table temp.ad_impala stored as parquet as select ymd,username,udid,result,requesttime,positions,logid,productname,systemname from ods.bdl_bigdata_online_ad where ymd>=calc_date(4);

在这里插入图片描述

  • 1亿多条数据,耗时28s

二、hive测试
建表SQL

create table temp.ad_hive stored as parquet as select ymd,username,udid,result,requesttime,positions,logid,productname,systemname from ods.bdl_bigdata_online_ad where ymd>=date_sub(current_date(),4);

在这里插入图片描述
同数据量情况下,耗时134s

查询性能测试

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值