- Ofrece una API de Python similar a Apache Spark / Dask, pero
→ no invoca el intérprete de Python
→ genera bytecode LLVM optimizado para el pipeline dado y el conjunto de datos de entrada
→ es entre 5 y 91x más rápido que el intérprete
-
Internamente se basa en compilación guiada por datos y procesamiento de modo dual, logrando una velocidad similar a la de un pipeline optimizado programado en C++
-
Soporta MacOS / Linux
-
Artículo presentado en SIGMOD '21: "Tuplex: Data Science in Python at Native Code Speed"
Aún no hay comentarios.