-
Plataforma para sincronizar y transformar grandes volúmenes de datos, ya sea en modo offline o en tiempo real
-
Proyecto de Apache Incubator (anteriormente llamado Waterdrop)
-
Fácil de usar, configurable de forma flexible y con desarrollo low-code
-
Soporte para streaming en tiempo real
-
Análisis de datos offline desde múltiples fuentes
-
Procesamiento de datos de alto rendimiento
-
Permite agregar y procesar datos con SQL
-
Soporte para Spark Structured Streaming
-
Soporte para Spark 2.x
-
Plugins compatibles
→ Input : Fake, File, Hdfs, Kafka, S3, Socket,..
→ Filter : Add, Checksum, Convert, Date, Drop, Grok, Json, Kv, Lowercase, Remove, Rename, Repartition, Replace, Sample, Split, Sql, Table, Truncate, Uppercase, Uuid,..
→ Output : ElasticSearch, File, Hdfs, Jdbc, Kafka, Mysql, S3, Stdout,..
Aún no hay comentarios.