
大数据
文章平均质量分 95
码农BookSea
Java开发工程师,写文章的初衷是为了沉淀我所学习,累积我所见闻,分享我所体验。站在巨人的肩膀上,我也能看得更远,希望和更多的人交流学习。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【Flink】全网最详细4W字Flink全面解析与实践(下)
文章目录Flink State状态CheckPoint & SavePointCheckPoint原理SavePoint原理StateBackend状态后端MemoryStateBackendFsStateBackendRocksDBStateBackend集群级配置StateBackendWindow滚动窗口滑动窗口会话窗口按键分区窗口和非按键分区窗口窗口函数(WindowFunction)增量窗口聚合函数全窗口函数增量窗口函数和全窗口函数结合使用Window重叠优化触发器(Trigger)移除器原创 2023-11-01 10:35:03 · 529 阅读 · 0 评论 -
【Flink】全网最详细4W字Flink全面解析与实践(上)
文章目录流处理 & 批处理无界流Unbounded Streams有界流Bounded StreamsFlink的特点和优势Flink VS SparkFlink APIDataflows数据流图Job Manager & Task Manager部署 & 运行部署模式运行模式提交和执行作业流程配置开发环境WordCount程序并行度并行度设置并行度生效优先级TaskOperator Chain(算子链)Task Slots分发规则Slot共享组并行度和Slots解释DataSour原创 2023-11-01 10:33:04 · 680 阅读 · 0 评论 -
【大数据】Spark入门指南:从基础概念到实践应用全解析
在这个数据驱动的时代,信息的处理和分析变得越来越重要。而在众多的大数据处理框架中,Apache Spark以其独特的优势脱颖而出。原创 2023-10-10 09:44:45 · 857 阅读 · 1 评论 -
【大数据】Scala语言入门:初学者的基础语法指南
作为一种在Java虚拟机(JVM)上运行的静态类型编程语言,Scala结合了面向对象和函数式编程的特性,使它既有强大的表达力又具备优秀的型态控制原创 2023-10-10 09:43:08 · 387 阅读 · 0 评论 -
【大数据】HBase入门指南
HBase是一个开源的非关系型分布式数据库,设计初衷是为了解决大量结构化数据存储与处理的需求。它的核心理念、特性以及应用领域在当今的大数据环境中都发挥着至关重要的作用,这也是我们需要深入理解HBase的原因原创 2023-10-10 09:36:57 · 802 阅读 · 0 评论