CDH6.3.2中安装kylin4

superhanliu

已于 2022-04-03 20:47:17 修改

阅读量2.6k

点赞数

CC 4.0 BY-SA版权

分类专栏：大数据文章标签： kylin

于 2022-04-02 17:20:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/superhanliu/article/details/123925119

大数据专栏收录该内容

9 篇文章

订阅专栏

本文讲述了作者在将Kylin 4.0部署在CDH 6环境中遇到的问题，涉及Spark版本选择、kerberos认证、目录权限设置、Spark下载与集成、Hive表导入问题，以及最终的包版本调整和解决步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、从kylin官网下载kylin4

因为看到版本4使用spark构建cube存与parquet中，更快更省更先进，且官网写支持cdh6

实际中kylin4要想跑起来还是很不顺利的

过程中还试验了kylin3，效果更差，启动都不行

2、选择1个kerberos认证过的用户，需要有hdfs权限？登录主机

配置kylin的整个目录的own和group都是这个用户（chgown）

配置kylin.properties，修改其中mysql数据库的配置(前提是要安装好mysql，分配好库和用户权限等)

3、执行bin/download-spark.sh 下载spark

cdh中自带有spark，通过配置spark_home来直接使用cdh的spark一直不行，应该还是版本兼容问题。最后迫于无赖根据上述命令下载了spark，成功后它会自动解压到kylin的spark目录下

4、这时候如果启动kylin，应该能成功，界面能打开并能登录进入操作，但是想载入cdh内hive中的表，还是不行，后台logs/kylin.log中会各种报错。针对此类问题，根据错误日志，逐个排查。基本都是版本不兼容导致，也很难解决

5、最终解决办法：备份并删掉kylin/spark/jars/spark*.jar，然后复制 cdh/lib/spark/jars/spark*.jar 到kylin/spark/jars/ 下，再重启kylin

6、成功！

7、后续使用中遇到的问题

7.1 构建cube时error，提示的还是class找不到等问题，经过排查，确实了hive的几个包以及spark的几个包，具体：

hive-beeline-1.2.1.spark2.jar
hive-cli-1.2.1.spark2.jar
hive-exec-2.1.1-cdh6.3.2.jar
hive-jdbc-1.2.1.spark2.jar
hive-metastore-1.2.1.spark2.jar

以上几个包从cdh的hive目录下找到复制到kylin/spark/jars下

spark-mesos_2.11-2.4.7.jar 这个包cdh也没有，就不复制了

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。