- Brendan Gregg anunció su salida de Intel después de 3 años y medio y que aceptó una nueva oportunidad.
- Durante su tiempo en Intel, desarrolló AI Flame Graphs y lo publicó como código abierto, además de impulsar un mapa de calor de GPU y el soporte de stack walking en Linux.
- Ejerció un liderazgo destacado en el eBPF Technical Steering Committee (BSC), fue copresidente de USENIX SREcon APAC 2023 y realizó 6 charlas magistrales.
- Participó en la formulación de la estrategia de nube de Intel, colaboró con 6 organizaciones, diseñó una estrategia interna con 33 propuestas concretas y llevó a cabo 110 reuniones con clientes.
- Señaló que dejó resultados incluso en un período difícil para Intel y espera que su trabajo en AI Flame Graphs y la estrategia de nube tenga un impacto duradero en el futuro de la compañía.
Salida de Intel y logros principales
- Brendan Gregg anunció que dejó Intel para aceptar una nueva oportunidad
- En un correo a los empleados de Intel, señaló que resumía sus actividades durante 3 años y medio
- Entre los proyectos públicos principales que realizó durante su tiempo en Intel, desarrolló AI Flame Graphs y lo liberó como código abierto (iaprof).
- Construyó un GPU subsecond-offset heatmap y habilitó la función de stack walking en Linux en colaboración con distribuciones de Linux.
- Dio una entrevista al The Wall Street Journal sobre monitoreo de seguridad con eBPF.
- Demostró liderazgo en el eBPF Technical Steering Committee (BSC) y fue copresidente de USENIX SREcon APAC 2023.
- Realizó un total de 6 charlas magistrales.
AI Flame Graphs y análisis de GPU
- AI Flame Graphs aún está en una etapa temprana, pero espera que en el análisis de GPU se convierta en una herramienta ampliamente adoptada, al igual que ocurre en el análisis de rendimiento de CPU.
- En el análisis de rendimiento de CPU, Flame Graph ya es lo habitual, pero en GPU su adopción todavía es limitada.
- También mencionó como restricción para su expansión que la versión de código abierto sea exclusiva de Intel.
- Prevé que la necesidad de AI Flame Graphs crecerá a medida que el código de GPU se vuelva más complejo.
Estrategia de nube y colaboración interna
- Lideró la definición de la estrategia de computación en la nube de Intel y participó en 110 reuniones con clientes.
- En colaboración con 6 organizaciones, diseñó una estrategia con 33 propuestas concretas y confeccionó un plan de renacimiento de la nube a nivel corporativo de Intel.
- Creó un mapa interorganizacional que visualiza las interacciones entre 19 equipos relacionados, considerado como el primer intento de este tipo dentro de Intel.
- Esa estrategia solo se compartió en diapositivas internas.
Experiencias y recuerdos en Intel
- Dijo que sus 3 años en Intel coinciden con uno de los momentos más difíciles de la historia de la empresa y que durante los primeros 15 meses hubo una moratoria de contratación.
- Aun así, expresó satisfacción por los resultados logrados.
- Entre las experiencias memorables mencionó el encuentro con Linus Torvalds, la conversación con Pat Gelsinger, una clase de surf en una salida fuera de la oficina en Australia y su conexión con Harshad Sane.
- Señaló que, al interactuar con los hardware fellows de Intel, amplió su comprensión de la estructura interna de los procesadores.
Planes futuros y mensaje para Intel
- Dijo que la implementación de las 33 propuestas previstas para los próximos años en Intel puede ser continuada por sus sucesores.
- La mayoría de las propuestas son retos difíciles porque requieren cambios de adopción, aprobación ejecutiva e inversión de largo plazo.
- Explicó que la documentación relevante quedó en la carpeta compartida con la alta dirección de Intel.
- Señaló que espera que su estrategia CloudTeams siga apoyando de forma constante el fortalecimiento de Intel.
- Finalmente, cerró su texto deseando éxito a Intel.
1 comentarios
Comentarios en Hacker News
Se suponía que los próximos años en Intel se enfocarían en ejecutar las "33 estrategias para recuperar la nube", pero suena algo poco realista creer que ese plan seguirá igual incluso después de que él se fue
Llevo 21 años trabajando ahí, y últimamente predomina el ambiente de hacer lo mínimo y solo cobrar el sueldo
Estos planes grandilocuentes al final terminan en manos de nadie
Al ver la frase “hice 110 reuniones con clientes para la estrategia de nube”, me sorprendió que haya gente que cuente eso
Hasta me dieron ganas de empezar a contarlas yo también; para la autopromoción sin duda ayuda
Y como empleado senior, también tengo la responsabilidad de reportar en qué uso mi tiempo
gcalclilas reuniones que incluyan clientes. Desde la perspectiva de un ingeniero, 110 reuniones con clientes es una cifra bastante altaMe cuesta conectar con esto de una “carta de despedida” después de solo 3 años y medio
Me parece difícil dejar un impacto tan grande en tan poco tiempo. Cuando ves cosas como “entrevista con el WSJ”, se siente como un texto de PR
En 3.5 años logró mucho dentro de una organización enorme y, siendo honestos, hasta da un poco de envidia
Lo de “entrevista con el WSJ” es solo lenguaje para managers; lo realmente lamentable es que la organización no supo aprovecharlo mejor
En otros textos había mencionado el cansancio de las reuniones nocturnas por la diferencia horaria
Sea cual sea la razón de su salida, ojalá encuentre un mejor balance entre vida y trabajo en su nuevo empleo
La colaboración asíncrona basada en documentos tenía sus límites, y tampoco era posible viajar seguido
Trabajar en el Intel actual significa aceptar esa realidad
Viendo los comentarios, hay muchas reacciones bastante agresivas
Parece que algunos no conocen bien los logros de Brendan Gregg. Sin duda es un ingeniero que merece respeto
Apenas leí el texto, me dio la impresión de que tenía una carga fuerte de autopromoción
Esto parece una clase magistral de cómo convertir un correo de renuncia en un “portafolio para la próxima oportunidad”
No lo digo como burla; me parece un gran ejemplo de cómo mostrar claramente el valor que uno creó
Intel está perdiendo talento competente muy rápido
No es la primera vez, ni será la última
Tengo una duda sobre performance en la nube
Corrí la misma máquina Intel de 192 núcleos en AWS, tanto en metal como en una instancia virtualizada, y en la virtualizada el throughput de CPU fue 20~25% menor
Me pregunto si es un problema de AWS, una pérdida del stack de software o algo a nivel de CPU
También quisiera saber si cambiar a AMD o Graviton mejoraría eso
En metal puede haber menos contaminación de caché, así que la diferencia de rendimiento podría venir de ahí
Me pregunto si ya perfilaste si hay overhead de virtualización por cosas como cifrado de memoria
/proc/cpuinfoHaciendo cuentas, parece que durante los últimos 6 meses tuvo muchas más reuniones nocturnas
Vive en Australia y la sede de Intel está en Estados Unidos
Post relacionado: 3 Years of Extremely Remote Work
En ese momento eran 77 reuniones, pero en este texto de despedida menciona 110 reuniones con clientes