-
Un lenguaje de programación y compilador similar a Python
-
Incluso investigadores sin experiencia en CUDA pueden escribir fácilmente código para GPU de alta eficiencia para deep learning
→ Ya hay implementaciones de kernels con una eficiencia aproximadamente 2 veces mejor que la implementación de Torch
-
Compatibilidad con Linux y GPUs de NVIDIA (las GPUs de AMD y otros CPU están en desarrollo)
-
El código base es similar a Numba, pero no usa SIMT; en su lugar, ejecuta en paralelo dentro de la instancia mediante operaciones a nivel de bloques
-
Arquitectura que convierte el código Python a Triton-IR y, a través del compilador de Triton, lo transforma en LLVM-IR
1 comentarios
Artículo del autor original: http://eecs.harvard.edu/~htk/publication/…
(OpenAI contrató a Philippe Tillet y ha seguido apoyando su desarrollo)