1 puntos por GN⁺ 2025-12-07 | 1 comentarios | Compartir por WhatsApp
  • Brendan Gregg anunció su salida de Intel después de 3 años y medio y que aceptó una nueva oportunidad.
  • Durante su tiempo en Intel, desarrolló AI Flame Graphs y lo publicó como código abierto, además de impulsar un mapa de calor de GPU y el soporte de stack walking en Linux.
  • Ejerció un liderazgo destacado en el eBPF Technical Steering Committee (BSC), fue copresidente de USENIX SREcon APAC 2023 y realizó 6 charlas magistrales.
  • Participó en la formulación de la estrategia de nube de Intel, colaboró con 6 organizaciones, diseñó una estrategia interna con 33 propuestas concretas y llevó a cabo 110 reuniones con clientes.
  • Señaló que dejó resultados incluso en un período difícil para Intel y espera que su trabajo en AI Flame Graphs y la estrategia de nube tenga un impacto duradero en el futuro de la compañía.

Salida de Intel y logros principales

  • Brendan Gregg anunció que dejó Intel para aceptar una nueva oportunidad
    • En un correo a los empleados de Intel, señaló que resumía sus actividades durante 3 años y medio
  • Entre los proyectos públicos principales que realizó durante su tiempo en Intel, desarrolló AI Flame Graphs y lo liberó como código abierto (iaprof).
  • Construyó un GPU subsecond-offset heatmap y habilitó la función de stack walking en Linux en colaboración con distribuciones de Linux.
  • Dio una entrevista al The Wall Street Journal sobre monitoreo de seguridad con eBPF.
  • Demostró liderazgo en el eBPF Technical Steering Committee (BSC) y fue copresidente de USENIX SREcon APAC 2023.
  • Realizó un total de 6 charlas magistrales.

AI Flame Graphs y análisis de GPU

  • AI Flame Graphs aún está en una etapa temprana, pero espera que en el análisis de GPU se convierta en una herramienta ampliamente adoptada, al igual que ocurre en el análisis de rendimiento de CPU.
    • En el análisis de rendimiento de CPU, Flame Graph ya es lo habitual, pero en GPU su adopción todavía es limitada.
    • También mencionó como restricción para su expansión que la versión de código abierto sea exclusiva de Intel.
  • Prevé que la necesidad de AI Flame Graphs crecerá a medida que el código de GPU se vuelva más complejo.

Estrategia de nube y colaboración interna

  • Lideró la definición de la estrategia de computación en la nube de Intel y participó en 110 reuniones con clientes.
  • En colaboración con 6 organizaciones, diseñó una estrategia con 33 propuestas concretas y confeccionó un plan de renacimiento de la nube a nivel corporativo de Intel.
    • Creó un mapa interorganizacional que visualiza las interacciones entre 19 equipos relacionados, considerado como el primer intento de este tipo dentro de Intel.
    • Esa estrategia solo se compartió en diapositivas internas.

Experiencias y recuerdos en Intel

  • Dijo que sus 3 años en Intel coinciden con uno de los momentos más difíciles de la historia de la empresa y que durante los primeros 15 meses hubo una moratoria de contratación.
  • Aun así, expresó satisfacción por los resultados logrados.
  • Entre las experiencias memorables mencionó el encuentro con Linus Torvalds, la conversación con Pat Gelsinger, una clase de surf en una salida fuera de la oficina en Australia y su conexión con Harshad Sane.
  • Señaló que, al interactuar con los hardware fellows de Intel, amplió su comprensión de la estructura interna de los procesadores.

Planes futuros y mensaje para Intel

  • Dijo que la implementación de las 33 propuestas previstas para los próximos años en Intel puede ser continuada por sus sucesores.
    • La mayoría de las propuestas son retos difíciles porque requieren cambios de adopción, aprobación ejecutiva e inversión de largo plazo.
    • Explicó que la documentación relevante quedó en la carpeta compartida con la alta dirección de Intel.
  • Señaló que espera que su estrategia CloudTeams siga apoyando de forma constante el fortalecimiento de Intel.
  • Finalmente, cerró su texto deseando éxito a Intel.

1 comentarios

 
GN⁺ 2025-12-07
Comentarios en Hacker News
  • Se suponía que los próximos años en Intel se enfocarían en ejecutar las "33 estrategias para recuperar la nube", pero suena algo poco realista creer que ese plan seguirá igual incluso después de que él se fue

    • Parece el patrón típico de llevarse el mérito si sale bien y que otra persona cargue con la culpa si sale mal
    • Creo que esta cultura de “consejos” tan detallados y pegajosos es resultado del culto a la personalidad que define al Intel actual
      Llevo 21 años trabajando ahí, y últimamente predomina el ambiente de hacer lo mínimo y solo cobrar el sueldo
      Estos planes grandilocuentes al final terminan en manos de nadie
  • Al ver la frase “hice 110 reuniones con clientes para la estrategia de nube”, me sorprendió que haya gente que cuente eso
    Hasta me dieron ganas de empezar a contarlas yo también; para la autopromoción sin duda ayuda

    • A mí en realidad me gusta medir las cosas. Como trabajo remoto, siento la presión de demostrar que trabajar desde casa sí es efectivo
      Y como empleado senior, también tengo la responsabilidad de reportar en qué uso mi tiempo
    • En las grandes empresas hay que expresar el propio valor con números, así que todos dejan este tipo de registros minuciosos
    • Si ves sus blogs recientes, se nota que por ser trabajador remoto de la sede de EE. UU. tenía presión por cuantificar sus resultados
    • Basta con buscar en gcalcli las reuniones que incluyan clientes. Desde la perspectiva de un ingeniero, 110 reuniones con clientes es una cifra bastante alta
    • Siempre hay que dejar notas de reunión. Después sirven para defenderte en escalaciones o reuniones de revisión
  • Me cuesta conectar con esto de una “carta de despedida” después de solo 3 años y medio
    Me parece difícil dejar un impacto tan grande en tan poco tiempo. Cuando ves cosas como “entrevista con el WSJ”, se siente como un texto de PR

    • Pero si lees sus otros textos, queda claro que es una persona fuera de lo común en términos de productividad
      En 3.5 años logró mucho dentro de una organización enorme y, siendo honestos, hasta da un poco de envidia
    • A mí no me generó mucho, pero otros seguramente pensarán: “un ingeniero de performance de nivel mundial se va a otra empresa”
    • Que este tipo de texto llegue a HN no necesariamente significa que lo publicó él mismo. Muchas veces un post del blog simplemente se difunde de forma natural
    • Llevo 16 años en mi empresa y todavía no he tenido un impacto visible destacado, así que me pega por ese lado
    • Él aplicó Flamegraph, que creó en 2011, al análisis de carga de GPU en la nube, y convenció a la empresa de liberar código interno como open source
      Lo de “entrevista con el WSJ” es solo lenguaje para managers; lo realmente lamentable es que la organización no supo aprovecharlo mejor
  • En otros textos había mencionado el cansancio de las reuniones nocturnas por la diferencia horaria
    Sea cual sea la razón de su salida, ojalá encuentre un mejor balance entre vida y trabajo en su nuevo empleo

    • Intel tiene equipos de ingeniería en casi todas las zonas horarias del mundo, así que para alguien siempre termina siendo una reunión a medianoche
      La colaboración asíncrona basada en documentos tenía sus límites, y tampoco era posible viajar seguido
      Trabajar en el Intel actual significa aceptar esa realidad
  • Viendo los comentarios, hay muchas reacciones bastante agresivas
    Parece que algunos no conocen bien los logros de Brendan Gregg. Sin duda es un ingeniero que merece respeto

    • Últimamente el ambiente en los comentarios está raro. Hay demasiados ataques sin fundamento, como si hubiera entrado puro trolleo
  • Apenas leí el texto, me dio la impresión de que tenía una carga fuerte de autopromoción

    • Pero, ¿de verdad lo necesita? Su nombre ya funciona como marca dentro de la comunidad técnica
  • Esto parece una clase magistral de cómo convertir un correo de renuncia en un “portafolio para la próxima oportunidad”
    No lo digo como burla; me parece un gran ejemplo de cómo mostrar claramente el valor que uno creó

  • Intel está perdiendo talento competente muy rápido
    No es la primera vez, ni será la última

  • Tengo una duda sobre performance en la nube
    Corrí la misma máquina Intel de 192 núcleos en AWS, tanto en metal como en una instancia virtualizada, y en la virtualizada el throughput de CPU fue 20~25% menor
    Me pregunto si es un problema de AWS, una pérdida del stack de software o algo a nivel de CPU
    También quisiera saber si cambiar a AMD o Graviton mejoraría eso

    • Recomiendo usar perf's top-down microarchitectural analysis
    • En las instancias nuevas de AWS, muchas funciones se descargan a hardware dedicado, así que entre VMs lo que se comparte suele ser el ancho de banda de memoria y la caché de niveles altos
      En metal puede haber menos contaminación de caché, así que la diferencia de rendimiento podría venir de ahí
    • Un overhead de ese tamaño es bastante grande. En AMD no era tan alto
      Me pregunto si ya perfilaste si hay overhead de virtualización por cosas como cifrado de memoria
    • Si se puede, estaría bien compartir una parte de /proc/cpuinfo
  • Haciendo cuentas, parece que durante los últimos 6 meses tuvo muchas más reuniones nocturnas
    Vive en Australia y la sede de Intel está en Estados Unidos
    Post relacionado: 3 Years of Extremely Remote Work
    En ese momento eran 77 reuniones, pero en este texto de despedida menciona 110 reuniones con clientes

    • Los dos números significan cosas distintas. Las 110 del texto de despedida son reuniones con clientes, y la cifra del post enlazado corresponde a reuniones en general