scalelph
是一个基于 Flink 和 Kubernetes 打造的开放数据平台,具备 Flink 和 SeaTunnel 任务管理能力。
在大数据领域中,开源项目如雨后春笋,层出不穷,计算引擎、存储引擎、查询引擎、数据湖,百花齐放,相关技术演进日新月异,让人应接不暇,但是总体呈现如下趋势:
实时即未来
为代表。对于企业来说,在释放数据能力上,越来越需要一站式数据平台
:
数据集成
、任务调度
和 ETL 任务
。数据质量
、数据血缘
、数据地图
、指标系统
和 数据建模
等。ad-hoc 查询
、BI 报表
、数据应用等。scaleph
定位在 admin 后台系统,整合、封装 Flink、SeaTunnel、Doris 等引擎,连通众多组件,提供开箱即用的一站式数据平台。
scaleph
始于 2022 年初,一开始的定位在于为 SeaTunnel 开发一个 web 管理系统,实现 SeaTunnel 任务的创建、提交、停止等功能,类似 DataX 和 DataX-Web 之类的组合。在数据集成的功能上不断扩展,逐步向相关领域扩展,支持的功能如下:
项目管理
数据集成
数据开发
Doris 集群运维
数据源管理。对主流数据源提供管理,支持数据源连接信息的统一管理和共享。
资源管理。Kubernetes 集群管理
数据标准。
后台系统。