# filling

**Repository Path**: dhd_index/filling

## Basic Information

- **Project Name**: filling
- **Description**: 非常易用，高性能、支持实时流式和离线批处理的海量数据处理产品，架构于 Apache Flink之上。
- **Primary Language**: Unknown
- **License**: GPL-3.0
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 2
- **Created**: 2022-02-27
- **Last Updated**: 2022-02-27

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

[![Maven Package](https://github.com/zihjiang/filling/actions/workflows/maven-publish.yml/badge.svg)](https://github.com/zihjiang/filling/actions/workflows/maven-publish.yml)
# Filling 

Filling, 如其名, 致力于填充你的各种存储,  是一个`非常易用`，`高性能`、支持`实时流式`和`离线批处理`的`海量数据`处理产品，架构于 `Apache Flink`之上。

---

filling设计思路参考waterdrop: [https://interestinglab.github.io/waterdrop/]


---

## 为什么我们需要 Filling

我们在使用 Flink 时发现了很多不便捷之处， 通过我们的努力让Filling的使用更简单，更高效，并将业界和我们使用Flink的优质经验固化到Filling中，明显减少学习成本，加快分布式数据处理能力在生产环境落地。
除了大大简化分布式数据处理难度外，Filling尽所能为您解决可能遇到的问题：

* 数据丢失与重复
* 任务堆积与延迟
* 吞吐量低
* 应用到生产环境周期长
* 缺少应用运行状态监控

## Filling 使用场景

* 海量数据ETL
* 海量数据聚合
* 多源数据处理

## Filling 的特性

*   简单易用，灵活配置，无需开发
*   实时流式处理
*   离线多源数据分析
*   高性能
*   海量数据处理能力
*   模块化和插件化，易于扩展
*   支持利用SQL做数据处理和聚合
*   支持flink
*   目前支持flink1.31.1

## Filling 的工作流程


![image-20211011150714876](./images/image-20211011150714876.png)


```Mermaid
graph TD
source[source] --> transfrom[transfrom]
transfrom --> sink[sink]
```
## 快速体验

#### [使用docker快速部署](https://zihjiang.github.io/filling-book/%E9%83%A8%E7%BD%B2/quick-install.html)

## Filling 功能截图

### 任务列表

![image-20211011150935022](./images/image-20211011150935022.png)

### 编辑任务
![image-20211011151632652](./images/image-20211011151632652.png)
### 查看任务
![image-20211011151528347](./images/image-20211011151528347.png)


多个Filter构建了数据处理的Pipeline，满足各种各样的数据处理需求，如果您熟悉SQL，也可以直接通过SQL构建数据处理的Pipeline，简单高效。目前Filling支持的[Filter列表](zh-cn/configuration/filter-plugin), 仍然在不断扩充中。您也可以开发自己的数据处理插件，整个系统是易于扩展的。

## Filling 支持的插件

* Input plugin

kafka, file, jdbc , 自行开发的Input plugin

* Filter plugin

DataAggregates,DecodeBase64,FieldOperation,FieldRename,FieldTypeConver, DataJoin, EncodeBase64,FieldOrder.,FieldSelect,Sql, DataSelector, FieldJavaScript, FieldRemove, FieldSplit, 自行开发的Filter plugin

* Output plugin

Elasticsearch, File, Jdbc, Kafka, Mysql, Stdout, 自行开发的Output plugin

## 环境依赖

1. java运行环境，java >= 11

2. 如果您要在集群环境中运行Filling，那么需要以下flink集群环境的任意一种：

* Flink on Yarn // TODO
* Flink Standalone
* Flink on Mesos // TODO

如果您的数据量较小或者只是做功能验证，也可以仅使用`local`模式启动，无需集群环境，Filling支持单机运行。

## 文档

[https://zihjiang.github.io/filling-book/]


## 贡献观点和代码

提交问题和建议：https://github.com/zihjiang/Filling/issues

贡献代码：https://github.com/zihjiang/Filling/pulls