Flink面试题.pdf大数据Flink知识点总结 一、Flink运行架构 Flink的运行架构主要由三个组件组成:JobManager、TaskManager和Client。Client是提交Job的客户端,可以运行在任何机器上,提交Job给JobManager,JobManager再调度任务到各个TaskManager去执行,然后TaskManager将心跳和统计信息汇报给JobManager。TaskManager之间以流的形式进行数据传输。JobManager主要负责调度Job并协调Task做checkpoint,职责上很像Storm的Nimbus。 二、Flink作业执行流程 Flink的作业执行流程可以分为以下步骤: 1. 客户端将代码转化为可以提交的JobGraph 2. 启动AM,申请资源 3. Client将Job提交给Dispatcher 4. Dispatcher开启一个新的JobManager线程 5. JM向Flink自己的ResourceManager申请slot资源来执行任务 6. RM向Yarn申请资源来启动TaskManager 7. Yarn分配Container来启动TaskManger 8. Flink的RM向TM申请slot资源来启动Task 9. TM将待分配的slot提供给JM 10. JM提交Task,TM启动新的线程来执行任务 三、Flink部署模式 Flink可以以多种方式部署,包括standalone模式、Yarn模式、Mesos模式、Kubernetes模式、Docker模式、AWS模式、Google Compute Engine模式、MAPR等。其中,Yarn模式是最常用的部署模式。 四、Flink on Yarn的部署 Flink on Yarn的部署有两种类型:Session共享Dispatcher和Resource ManagerDispatcher和Resource Manager共享资源。Session模式需要先启动集群,然后在提交作业,而Resource Manager模式可以按照需求申请资源。如果资源满了,下一个作业就无法提交,只能等到yarn中的其中一个作业执行完成后,释放了资源,那下一个作业才会正常提交。 五、Flink与Yarn集成 Flink可以与Yarn集成,使用Yarn来管理资源和调度任务。Flink可以在Yarn上运行,可以使用Yarn的调度器来调度任务,也可以使用Flink自己的ResourceManager来管理资源。 六、Flink的优点 Flink有很多优点,包括: * 高性能:Flink可以处理高吞吐量的数据流,具有高性能和低延迟。 * 可扩展性:Flink可以水平扩展,满足大规模数据处理的需求。 * 灵活性:Flink支持多种数据源和sink,支持多种编程语言和API。 * 可靠性:Flink具有高可靠性,具有自动故障恢复和重试机制。 七、Flink的应用场景 Flink有很多应用场景,包括: * 实时数据处理:Flink可以处理高吞吐量的实时数据流,满足实时数据处理的需求。 * 数据集成:Flink可以集成多种数据源,满足数据集成的需求。 * 数据分析:Flink可以对数据进行实时分析和处理,满足数据分析的需求。 * 机器学习:Flink可以与机器学习平台集成,满足机器学习的需求。















剩余8页未读,继续阅读


- 粉丝: 3498
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 向往C语言程序设计教案.pptx
- 西门子S7-200PLC与MCGS组态在污水处理控制系统中的应用及优化
- 基于单片机微型打印机系统控制设计.doc
- 网络购物的发展前景-怎样看待网络购物的发展前景趋势.docx
- 校园网络设计方案(网络规划)模板.doc
- 网络传输介质与网络设备.ppt
- 蓝代斯克网络安全准入解决方案.doc
- CoSec-Kotlin资源
- 知识表示方法语义网络和框架表示方法.ppt
- 网络营销教学实验——网络定价策略.doc
- 智慧城市时空信息云平台项目设计书.docx
- 电子商务实习报告总结(2).doc
- 信息网络安全保护方案.doc
- 基于Comsol技术的弯曲波导模式分析:有效折射率与损耗精确计算方法 电磁仿真 详解
- 社会网络研究样本.doc
- 信息系统安全和社会责任.pptx


