- Un framework orientado a unificar el procesamiento de streaming / procesamiento por lotes / cargas de trabajo de cómputo de alto rendimiento (IA)
- Actualmente ofrece una solución de reemplazo drop-in para Spark SQL y la API de Spark DataFrame (compatible)
- Puede ejecutarse en una sola máquina o en una configuración distribuida
- Según el benchmark TPC-H, es 4 veces más rápido que Spark, reduce en 94% el costo de hardware y no requiere cambios de código
- Disponible como paquete de Python:
pip install "pysail==0.2.0.dev0"
- Stack tecnológico
- Motor basado en Rust, construido sobre Apache Arrow y Apache DataFusion
- La sesión de Spark se comunica con el servidor de Sail usando el protocolo Spark Connect
Aún no hay comentarios.