Apache superset直连hive如何配置yarn资源队列参数(已解决）

最新推荐文章于 2024-06-06 12:57:50 发布

原创最新推荐文章于 2024-06-06 12:57:50 发布 · 1.1k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#apache superset #资源队列设置 #hive #hiveThrift #SparkThrift

大数据组件专栏收录该内容

23 篇文章

订阅专栏

本文介绍如何配置Superset以连接Hive并指定YARN资源队列，实现高效查询。同时，还介绍了如何利用Superset连接Spark及Presto，并提供了相关配置示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

对于小公司来说，superset这款BI工具相当优秀，丰富的数据源，炫酷的dashboard，满足基本业务查询展示需求

现在关注下查询hive，superset可以直接对接hive或者通过presto

由于公司大数据yarn集群设置有资源队列，即 mapred.job.queue.name，在直连hive的时，如果不配置此参数，任务无法提交到yarn上解析运行

如何配置呢？

环境：集成了ldap的hive，资源队列划分

在这个URI里是配置不了资源队列的，资源队列配置如下

"connect_args":{"configuration": {"mapred.job.queue.name":"root.zm_yarn_pool.development"}}

这么搞一搞，superset就可以愉快的运行hive sql了

福利--------------------------福利连hive送spark

上面的是连接hiveThrift，在 https://blog.csdn.net/qq_34864753/article/details/102729859 这篇博客里面我们在CDH上启动了sparkThrift服务，来，连一连

注意：spark这里是kerberos验证，所以zmbd-vpc-wk01以及我们安装superset机器用户上的hive票据要有效，比如我在host01的admin用户下安的，那么admin用户下hive票据必须是有效的，这里我们使用crontab 定时去刷新票据，以防过期

然后就可以耍起来了，而且spark比hive快很多

福利--------------------------福利连spark送presto

https://blog.csdn.net/Alongpo/article/details/89571606

福利--------------------------福利连presto送superset安装

https://blog.csdn.net/qq_34864753/article/details/93517511 也按照官网安装一样简单，不过博客写了还是希望有人看的

另外360检测低版本的superset存在安全风险，建议升级到最新的0.37.1版本，上述安装的是0.28.1版本

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。