# filling **Repository Path**: dhd_index/filling ## Basic Information - **Project Name**: filling - **Description**: 非常易用,高性能、支持实时流式和离线批处理的海量数据处理产品,架构于 Apache Flink之上。 - **Primary Language**: Unknown - **License**: GPL-3.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 2 - **Created**: 2022-02-27 - **Last Updated**: 2022-02-27 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README [![Maven Package](https://github.com/zihjiang/filling/actions/workflows/maven-publish.yml/badge.svg)](https://github.com/zihjiang/filling/actions/workflows/maven-publish.yml) # Filling Filling, 如其名, 致力于填充你的各种存储, 是一个`非常易用`,`高性能`、支持`实时流式`和`离线批处理`的`海量数据`处理产品,架构于 `Apache Flink`之上。 --- filling设计思路参考waterdrop: [https://interestinglab.github.io/waterdrop/] --- ## 为什么我们需要 Filling 我们在使用 Flink 时发现了很多不便捷之处, 通过我们的努力让Filling的使用更简单,更高效,并将业界和我们使用Flink的优质经验固化到Filling中,明显减少学习成本,加快分布式数据处理能力在生产环境落地。 除了大大简化分布式数据处理难度外,Filling尽所能为您解决可能遇到的问题: * 数据丢失与重复 * 任务堆积与延迟 * 吞吐量低 * 应用到生产环境周期长 * 缺少应用运行状态监控 ## Filling 使用场景 * 海量数据ETL * 海量数据聚合 * 多源数据处理 ## Filling 的特性 * 简单易用,灵活配置,无需开发 * 实时流式处理 * 离线多源数据分析 * 高性能 * 海量数据处理能力 * 模块化和插件化,易于扩展 * 支持利用SQL做数据处理和聚合 * 支持flink * 目前支持flink1.31.1 ## Filling 的工作流程 ![image-20211011150714876](./images/image-20211011150714876.png) ```Mermaid graph TD source[source] --> transfrom[transfrom] transfrom --> sink[sink] ``` ## 快速体验 #### [使用docker快速部署](https://zihjiang.github.io/filling-book/%E9%83%A8%E7%BD%B2/quick-install.html) ## Filling 功能截图 ### 任务列表 ![image-20211011150935022](./images/image-20211011150935022.png) ### 编辑任务 ![image-20211011151632652](./images/image-20211011151632652.png) ### 查看任务 ![image-20211011151528347](./images/image-20211011151528347.png) 多个Filter构建了数据处理的Pipeline,满足各种各样的数据处理需求,如果您熟悉SQL,也可以直接通过SQL构建数据处理的Pipeline,简单高效。目前Filling支持的[Filter列表](zh-cn/configuration/filter-plugin), 仍然在不断扩充中。您也可以开发自己的数据处理插件,整个系统是易于扩展的。 ## Filling 支持的插件 * Input plugin kafka, file, jdbc , 自行开发的Input plugin * Filter plugin DataAggregates,DecodeBase64,FieldOperation,FieldRename,FieldTypeConver, DataJoin, EncodeBase64,FieldOrder.,FieldSelect,Sql, DataSelector, FieldJavaScript, FieldRemove, FieldSplit, 自行开发的Filter plugin * Output plugin Elasticsearch, File, Jdbc, Kafka, Mysql, Stdout, 自行开发的Output plugin ## 环境依赖 1. java运行环境,java >= 11 2. 如果您要在集群环境中运行Filling,那么需要以下flink集群环境的任意一种: * Flink on Yarn // TODO * Flink Standalone * Flink on Mesos // TODO 如果您的数据量较小或者只是做功能验证,也可以仅使用`local`模式启动,无需集群环境,Filling支持单机运行。 ## 文档 [https://zihjiang.github.io/filling-book/] ## 贡献观点和代码 提交问题和建议:https://github.com/zihjiang/Filling/issues 贡献代码:https://github.com/zihjiang/Filling/pulls