大数据安全

hadoop中没有中央服务器来认证用户,也没有安全网关或者认证机制。被授权可以访问NameNode的用户理论上能够删除数据或者假冒其他用户访问他们不应该访问的数据。 hadoop中也没有任何用于角色分配或对象层级访问的机制

Hadoop安全包括三个主要概念:

  • 验证(可用Kerberos)
  • 授权(可用Sentry)
  • 审计

既要保护静态数据、也要保护传输中的数据

0. Hadoop自带的用户权限体系

每个关键的hadoop守护进程需要在单独的用户下运行,需要的三个用户:

  • yarn 用户用于管理RM
  • mapred 用户用来管理mr服务
  • hdfs 用户用来管理HDFS文件系统

groupadd hadoop

useradd -g hadoop yarn # yarn owns the YARN  related services

useradd -g hadoop hdfs # hdfs ownsthe HDFS services

useradd -g hadoop mapred # mapred owns the MapReduce services

1. Kerberos

Kerberos是一个开源的网络身份验证协议,它假设主机是可信任的(但网络不是)

验证主要有3个步骤:

  • 认证服务器授予客户端要求访问Hadoop集群的授权票据(TGT)
  • 客户端使用它们的凭据解密TGT,并使用TGT从票证授予服务器(TGS)获取服务票证
  • 客户端使用TGS授予的服务票据来访问Hadoop集群
2. Apache Sentry

  • Linux下的用户,以及用户组
  • Hive的角色
  • 使用hue的用户
3. Apache Ranger

4. Apache Knox

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值