最新架构设计之大数据架构(Lambda架构、Kappa架构)

本文深入探讨了大数据领域的两种重要架构——Lambda架构和Kappa架构。Lambda架构通过批处理层、加速层和服务层实现数据处理,具有良好的容错性和灵活性,但存在编码开销和扩展成本问题。Kappa架构则简化为实时数据处理,统一实时和离线代码,然而面临性能瓶颈和数据丢失的风险。实际案例中,Kafka和ZooKeeper等工具在这些架构中起到关键作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Kafka:一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据。

ZooKeeper:开放源码的分布式应用程序协调服务,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。

三. Lambda架构

3.1 Lambda架构分解为三层

在这里插入图片描述

  • 批处理层(Batch Layer):两个核心功能,存储数据集和生成Batch View。
  • 加速层(Speed Layer):存储实时视图并处理传入的数据流,以便更新这些视图。
  • 服务层(Serving Layer):用于响应用户的查询请求,合并 Batch View 和 Real-time View 中的结果数据集到最终的数据集。

3.2 优缺点

其优点:
 容错性好、查询灵活度高 、易伸缩、易扩展

其缺点:
 全场景覆盖带来的编码开销。 针对具体场景重新离线训练一遍,益处不大。重新部署和迁移成本很高。

3.3 实际案例

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值