11 puntos por xguru 2024-12-01 | Aún no hay comentarios. | Compartir por WhatsApp
  • Un framework orientado a unificar el procesamiento de streaming / procesamiento por lotes / cargas de trabajo de cómputo de alto rendimiento (IA)
  • Actualmente ofrece una solución de reemplazo drop-in para Spark SQL y la API de Spark DataFrame (compatible)
  • Puede ejecutarse en una sola máquina o en una configuración distribuida
  • Según el benchmark TPC-H, es 4 veces más rápido que Spark, reduce en 94% el costo de hardware y no requiere cambios de código
  • Disponible como paquete de Python: pip install "pysail==0.2.0.dev0"
  • Stack tecnológico
    • Motor basado en Rust, construido sobre Apache Arrow y Apache DataFusion
    • La sesión de Spark se comunica con el servidor de Sail usando el protocolo Spark Connect

Aún no hay comentarios.

Aún no hay comentarios.