SeaTunnel(原名 Waterdrop)是一个分布式、高性能、易扩展的数据集成平台,专注于大数据领域的数据同步、数据迁移和数据转换。它支持多种数据源和数据目标,并可以与 Apache Flink、Spark 等计算引擎集成。以下是 SeaTunnel 的核心架构详解:
SeaTunnel 核心架构
SeaTunnel 的架构设计分为以下几个核心模块:
1. 数据源(Source)
- 功能:负责从外部系统读取数据。
- 支持的数据源:
- 关系型数据库(MySQL、PostgreSQL、Oracle 等)。
- NoSQL 数据库(MongoDB、Cassandra、Elasticsearch 等)。
- 消息队列(Kafka、RabbitMQ 等)。
- 文件系统(HDFS、S3、FTP 等)。
- 特点:
- 支持批量读取和流式读取。
- 插件化设计,用户可以根据需求扩展新的数据源。
2. 数据转换(Transform)
- 功能:对从 Source 读取的数据进行清洗、过滤、聚合等操作。