Un rastro JIT del mundo real en el Core Dev Sprint de CPython

(antocuni.eu)

9 puntos por darjeeling 2025-10-01 | Aún no hay comentarios. | Compartir por WhatsApp

Este es un resumen en profundidad de los retos técnicos que enfrenta el nuevo compilador JIT (Just-In-Time) basado en trazas de CPython.

Bloqueadores de trazas (Trace Blockers)

El JIT de trazas identifica durante la ejecución del programa las rutas de código que se ejecutan con frecuencia ("rutas calientes"), y registra las microoperaciones (micro-operations) de esas rutas para generar código máquina optimizado. Sin embargo, este proceso se interrumpe cuando el JIT se encuentra con código cuyo interior no puede inspeccionar, es decir, con un "bloqueador de trazas". En el caso de CPython, un ejemplo representativo es llamar funciones de extensión escritas en C.

Explicación técnica: el blog pone como ejemplo una función de Python puro que calcula pi (π). El JIT de PyPy optimiza este bucle de cálculo numérico de manera muy eficiente y logra un rendimiento 42 veces superior al de CPython. Pero si dentro del bucle se agrega una sola llamada a una función en C que el JIT no puede rastrear (hic_sunt_leones()), el rendimiento de PyPy cae bruscamente hasta quedar apenas 1.8 veces por encima de CPython. Ese único "bloqueador de trazas" inutiliza gran parte de la capacidad de optimización del JIT. Esto sucede porque el JIT no puede conocer el funcionamiento interno de la función en C, así que no puede optimizar todo el bucle como una sola unidad y debe separar el código antes y después de la llamada a la función en C.

Flujo de control impulsado por datos (Data-Driven Control Flow)

Este problema aparece cuando el flujo de control del programa cambia mucho según los datos de entrada. El JIT de trazas funciona mejor bajo la suposición de que existe una "ruta caliente" consistente, pero cuando la ruta de ejecución cambia constantemente según los datos, esa suposición deja de cumplirse.

Explicación técnica: el blog usa como ejemplo una función que recibe 9 argumentos. Cada argumento puede ser None o un número, y dentro de la función aparecen en secuencia condicionales con la forma if <var> is None: .... En este caso, la ruta de código ejecutada cambia cada vez según la combinación de valores None en los argumentos. Por eso, el JIT se enfrenta al problema de un "número exponencial de trazas (exponential number of traces)". Es decir, el JIT intenta generar código optimizado por separado para todas las combinaciones posibles de argumentos None, lo que provoca una sobrecarga enorme y termina haciendo que el rendimiento sea incluso mucho peor que el de CPython sin JIT.

En conclusión, esta entrada del blog subraya que, para que el nuevo JIT de trazas de CPython se consolide con éxito, tendrá que resolver estos problemas de "bloqueadores de trazas" y "flujo de control impulsado por datos". Esto sugiere que no se trata solo de un problema de implementación, sino posiblemente de una limitación fundamental de la propia tecnología de JIT basada en trazas.

Un rastro JIT del mundo real en el Core Dev Sprint de CPython

Bloqueadores de trazas (Trace Blockers)

Flujo de control impulsado por datos (Data-Driven Control Flow)

Lecturas relacionadas

Aún no hay comentarios.