- El problema de la salida de ingenieros senior no es de flujo de información, sino de la estructura de incentivos de la dirección; un sistema de compensación optimizado para resultados trimestrales entra en conflicto de forma fundamental con la retención de talento, que requiere inversión de largo plazo
- Cuando se va un solo ingeniero senior, el costo total puede llegar a 500 mil a 1 millón de dólares; gastos de contratación, costo de la vacante, onboarding y pérdida de conocimiento tácito (tribal knowledge) quedan dispersos en varios presupuestos y por eso no se ven
- En el caso de una empresa de procesamiento de pagos que ignoró una advertencia 14 meses antes, la pérdida en Black Friday fue de 3.47 millones de dólares, cuando el costo original de corregirlo era de apenas 80 mil dólares
- Se proponen 6 intervenciones estructurales (contabilidad del costo de rotación, seguimiento de incidentes, guardias ejecutivas, reflejar la retención en la compensación, consejo asesor técnico y compensación equivalente para la ruta IC) como solución para realinear incentivos
- Estas intervenciones solo funcionan cuando la dirección reconoce la retención como un problema económico y está dispuesta a aceptar cambios estructurales; una implementación meramente formal puede incluso generar el efecto contrario
Por qué, aunque la información fluya, el comportamiento no cambia
"The constraint is not information flow. It is economics."
- Este texto es la segunda parte de una serie sobre la salida de ingenieros, y continúa lo tratado en la parte 1, Por qué tus mejores ingenieros están entrevistándose en otros lugares, después del problema de asimetría de información
- En la parte 1 se explicó por qué se van los ingenieros senior, y la causa central era una estructura en la que, aun existiendo problemas, estos no llegan a la dirección
- Pero este texto lleva esa suposición un paso más allá
- Trata de qué ocurre cuando realmente se mejora el flujo de información
- La conclusión, contra la intuición, es que en la mayoría de los casos no cambia nada
- Las organizaciones introducen varios mecanismos para detectar problemas
- Reuniones 1:1 de skip level
- Canales de feedback anónimo
- Encuestas de retención realizadas por consultores externos
- Como resultado, los ingenieros comunican los problemas con total claridad
- La deuda técnica está desgastando la moral
- Se está ignorando la experiencia técnica en las decisiones de arquitectura
- La carga de on-call está en un nivel no sostenible
- La dirección escucha esto y asiente
- Reconoce los problemas
- Dice que va a reajustar prioridades
- Pero cuando cambia el trimestre, las decisiones se repiten exactamente igual que antes
- Se cumplen los objetivos trimestrales del mismo modo
- Y ese modo consiste en volver a ignorar los problemas que acaban de escuchar
- En este punto, el texto deja clara la idea central
- El problema no es la falta de información
- El problema es la estructura económica, es decir, el diseño de incentivos
El problema central: la estructura de incentivos de los ejecutivos
- Ejemplo del cálculo de decisión al que se enfrenta un VP of Engineering en octubre
- Faltan 3 meses para la revisión de desempeño trimestral y 6 meses para el vesting de las acciones del ingeniero
- Un ingeniero senior de plataforma pide lo siguiente
- Quiere refactorizar durante 6 semanas el sistema de autenticación
- La deuda técnica se ha acumulado y la estructura se ha vuelto frágil
- Dos investigadores de seguridad ya habían señalado señales de riesgo
- Pero la situación actual es ambigua
- No hay incidentes reales, no hay quejas de clientes ni impacto en ingresos
- Lo único que existe es la advertencia del ingeniero de que “si no se corrige ahora, se convertirá en una crisis”
- Para el VP hay dos opciones
- Opción A: aprobar la refactorización
- Aceptar una reducción de 6 semanas en la velocidad de desarrollo de funcionalidades
- Surge la posibilidad de no cumplir los OKR del trimestre
- Tendrá que explicarle al CEO por qué se retrasó el roadmap por “trabajo técnico que el cliente no puede ver”
- También existe el riesgo de afectar la fecha de lanzamiento de funcionalidades que el equipo de ventas ya prometió
- Como resultado, puede haber un impacto negativo directo en el bono de fin de año
- La recompensa de esta decisión llega 12 a 18 meses después: que ese ingeniero senior se quede en la organización porque “se respeta su criterio técnico”
- Opción B: priorizar funcionalidades
- Reconocer que la deuda técnica “es importante”, pero aplazarla “al próximo trimestre”
- Lanzar el roadmap planeado tal como está, cumplir los OKR y cobrar el bono
- El ingeniero senior se queda por ahora, porque sus stock options todavía no han hecho vesting
- Si el sistema de autenticación explota después, será un problema de un trimestre futuro
- Si el ingeniero se va 6 meses después, se asume que se puede reemplazar con contratación
- Opción A: aprobar la refactorización
- En esta estructura, la opción B siempre gana, hasta que falla
- B gana hasta que ocurre una falla en un sistema clave durante un lanzamiento de producto, se van 5 ingenieros senior en 18 meses y el CFO empieza a preguntar por qué están gastando 1.4 millones de dólares al año en recontratación
- Porque se trata de una desalineación fundamental
- La estructura de compensación ejecutiva está optimizada para el desempeño trimestral
- Pero la retención de ingenieros y la reducción de deuda técnica requieren inversión de largo plazo
- Mejorar solo el flujo de información no puede cerrar esa brecha
- La solución es rediseñar la propia estructura económica
Why the Math Favors Dysfunction - Si haces las cuentas, la disfunción es inevitable
-
Los costos ocultos operan de forma invisible, haciendo que actores racionales se comporten de manera irracional
-
Si se va un solo ingeniero senior con un salario de $200,000, el costo total real se calcula en $500,000 a más de $1,000,000
- La mayoría de los ejecutivos cree que esta cifra es exagerada cuando la escucha, pero no lo es. Así se calcula:
-
Costos directos de reemplazo: $85,000-$100,000
- Tarifas de contratación: con reclutadores externos, una comisión del 20-25%; para un ingeniero de $200,000, eso equivale a $40,000-$50,000
- Si se gestiona internamente (bolsas de trabajo, herramientas de sourcing, salario del reclutador), serían $15,000-$20,000
- Bono de contratación: en un mercado competitivo, se necesitan $20,000-$40,000 para asegurar un candidato senior
- Es especialmente indispensable cuando la persona cambia de empresa dejando equity sin consolidar en su empleador actual
- Costos de mudanza: en este caso, una mudanza nacional sería de $10,000-$30,000; internacional, más
- Tarifas de contratación: con reclutadores externos, una comisión del 20-25%; para un ingeniero de $200,000, eso equivale a $40,000-$50,000
-
Costo de vacante: $50,000-$100,000
- Contratar a un ingeniero senior toma en promedio 3 a 6 meses
- Durante la vacante, el trabajo de ese ingeniero no se detiene y se generan simultáneamente dos tipos de costo
- uno es la caída en la productividad del equipo por la redistribución del trabajo, y el otro es el costo de oportunidad por el trabajo abandonado
- Costo por redistribución del trabajo: $25,000-$40,000:
- Aproximadamente el 60% del trabajo del ingeniero que se fue se distribuye entre el resto del equipo
- No se trata de una reasignación libre de recursos, sino de una pérdida de productividad
- Los ingenieros, que ya están al límite de carga de trabajo, ahora deben hacer code reviews en áreas que no dominan, responder preguntas sobre sistemas que no construyeron y dar mantenimiento a servicios que no entienden por completo
- Si 3 ingenieros absorben cada uno un 20% de trabajo adicional, no es simplemente trabajar 20% más: la eficiencia total baja por el cambio constante de contexto
- Esto genera una pérdida de productividad de 10-15% por ingeniero durante el periodo de vacante
- Cálculo del costo por redistribución del trabajo
- número de ingenieros que absorben el trabajo × tasa de caída de productividad × duración de la vacante (meses) × (salario promedio / 12)
- En un escenario típico: 3 ingenieros × 12% de caída de productividad × 4 meses × ($180,000 / 12) = $21,600
- Si el ingeniero que se fue estaba a cargo de un área de alta especialización como infraestructura, seguridad o plataforma, la cifra puede subir a $30,000-$40,000
- Costo por trabajo abandonado: $25,000-$60,000:
- El 40% restante no se redistribuye, sino que se pospone o se abandona por completo
- Mejoras de plataforma, reducción de deuda técnica, evolución de la arquitectura, documentación y mentoría: trabajos que no están ligados al lanzamiento de funciones, pero que previenen problemas futuros, y que desaparecen silenciosamente del roadmap
- El costo inmediato del trabajo abandonado se calcula como el valor salarial equivalente del trabajo que no se realizó
- El 40% del trabajo del ingeniero que se fue no se ejecuta durante el periodo de vacante
- La fórmula es 40% × 4 meses × ($200,000 / 12) = $26,667
- Pero el costo real no termina ahí
- El trabajo aplazado genera costos acumulados a lo largo de los trimestres siguientes
- Por ejemplo
- si se retrasa una optimización de base de datos planificada por un ingeniero senior de infraestructura
- el rendimiento de las consultas se degrada gradualmente
- y al final se requiere una respuesta de emergencia mucho mayor que el alcance original del trabajo
- si se detienen las revisiones de arquitectura que llevaba ese ingeniero
- las decisiones técnicas siguen avanzando
- sin la experiencia que podía detectar de antemano errores costosos
- si se retrasa una optimización de base de datos planificada por un ingeniero senior de infraestructura
- El costo medible del trabajo abandonado es
- el valor del “trabajo que debería haberse hecho, pero no se hizo”
- una fórmula conservadora sería la siguiente
- (proporción de trabajo abandonado × salario anual / 12) × meses de vacante
- (40% × $200,000 / 12) × 4 meses = $26,667
- El rango realista del costo por trabajo abandonado es de $25,000-$60,000
- depende de qué proporción del trabajo abandonado era preventivo frente a orientado a funciones
- Costo total de vacante (Combined Vacancy Cost): $50,000-$100,000
- Es la suma de dos componentes: costo por redistribución del trabajo $25,000-$40,000 + costo por trabajo abandonado $25,000-$60,000
- Esta cifra solo refleja el impacto directo y medible de tener el puesto vacante durante 4 meses
- El cálculo en sí es conservador
-
Costos de onboarding y adaptación: $100,000-$125,000
- Productividad de un nuevo ingeniero senior: alrededor de 25% en el mes 1, 50% en los meses 2-3, 75% en los meses 4-5, y productividad completa al mes 6
- Mes 1: pérdida de productividad del 75% = ($200,000 / 12 meses) × 0.75 = $12,500
- Meses 2-3: pérdida de productividad del 50% = ($200,000 / 12 meses) × 0.50 × 2 = $16,667
- Meses 4-5: pérdida de productividad del 25% = ($200,000 / 12 meses) × 0.25 × 2 = $8,333
- Total de brecha de productividad en los primeros 6 meses: $37,500
- Costo del personal de onboarding: el nuevo ingeniero senior consume de 10 a 15 horas semanales de otros ingenieros en el primer mes, y de 5 a 8 horas semanales en los meses 2-3
- Mes 1: 12 horas por semana × 4 semanas × $90 por hora = $4,320
- Meses 2-3: 6 horas por semana × 8 semanas × $90 por hora = $4,320
- Costo del personal de onboarding a una tarifa de $90 por hora: $8,640
- Es decir, en los primeros 6 meses se genera una pérdida de $46,140
- Pero como a la mayoría de los ingenieros senior les toma alrededor de 1 año alcanzar el mismo nivel de conocimiento del dominio que el ingeniero anterior, se estima un total de $92,000-$125,000
- Productividad de un nuevo ingeniero senior: alrededor de 25% en el mes 1, 50% en los meses 2-3, 75% en los meses 4-5, y productividad completa al mes 6
-
Pérdida de conocimiento tribal: $100,000-$300,000
- Es lo más difícil de cuantificar, pero aparece más adelante en forma de errores en los trimestres siguientes
- Lo que sabía el ingeniero que se fue:
- qué partes del codebase son frágiles y requieren cambios cuidadosos
- qué clientes tenían requisitos especiales y por qué
- qué decisiones de arquitectura eran trade-offs intencionales vs. deuda técnica
- cuáles son las 3 líneas de código realmente importantes dentro de un servicio de 10,000 líneas
- por qué cierta consulta a la base de datos parece ineficiente pero fue escrita así (una optimización “obvia” provocó corrupción de datos bajo una condición específica descubierta hace 3 años)
- Errores por falta de contexto: un nuevo ingeniero optimiza una consulta “lenta” y rompe el flujo de trabajo crítico de los 2 clientes más grandes de la empresa
- 2 días para diagnosticar el problema ($4,615), 1 semana para implementar la corrección adecuada ($7,692), recuperación de la relación con el cliente
- El costo de un solo incidente es de aproximadamente $12,000-$15,000, y ocurre entre 3 y 5 veces en el primer año por cada ingeniero senior que se va
- Retraso en la toma de decisiones: una pregunta que el ingeniero que se fue respondía en 30 segundos ahora requiere 3 horas de arqueología de código, búsqueda en el historial de Slack y conversaciones de “¿alguien sabe por qué esto se hizo así?”
- Si ocurre 2 veces por semana durante 6 meses: $14,040
- Proyectos aplazados o abandonados: solo el ingeniero que se fue entendía lo suficiente el sistema de autenticación como para implementar de forma segura una integración SSO
- Ese proyecto se retrasa 6-9 meses, y si SSO era necesario para un contrato empresarial de $500,000, el costo del retraso es medible
- Una estimación conservadora de esta pérdida de conocimiento interno: $100,000 a $300,000 durante los 12 meses posteriores a la salida
-
Costo total por cada salida de un ingeniero
- Reemplazo directo: $85,000-$100,000
- Costo de vacante: $50,000-$100,000
- Adaptación y onboarding: $92,000-$125,000
- Pérdida de conocimiento interno: $100,000-$300,000
- Total conservador: $327,000-$625,000
- Total realista incluyendo retrasos de proyectos y costo de oportunidad: $500,000-$1,000,000
-
Estos costos se distribuyen en todo el presupuesto y quedan ocultos entre el ruido: los costos de contratación van al presupuesto de RR. HH., la pérdida de productividad no se rastrea y la evaporación del conocimiento interno no aparece en los informes trimestrales
- Aplazar la deuda técnica y priorizar funcionalidades genera resultados inmediatos y visibles: demos para el equipo de ventas, anuncios de lanzamiento de marketing, informes del CEO al consejo, etc.
- Es lo que los economistas llaman el problema de la "rana hervida":
- La salida de cada empleado parece manejable, postergar el trabajo técnico parece razonable y las concesiones trimestrales también parecen justificadas de manera individual
- Para cuando el patrón se vuelve evidente (18% de rotación anual de ingenieros senior, deuda técnica acumulada, fallas encadenadas de sistemas), la organización ya ha aceptado la disfunción como algo normal
¿Cómo se ve la recuperación (Recovery)?
- Catorce meses antes del desastre del Black Friday, un ingeniero senior de plataforma de una empresa mediana de procesamiento de pagos planteó preocupaciones concretas
- "El sistema de procesamiento de transacciones no soportará el tráfico esperado de las fiestas"
- Presentó una propuesta detallada indicando que se necesitaban sharding de base de datos y optimización de colas: 6 semanas de tiempo de ingeniería y un costo estimado de infraestructura de $80,000
- La VP of Product lo relegó en prioridad:
- Se consideró que el lanzamiento de otras dos funciones era más importante
- En la revisión trimestral se elogió su "capacidad para detectar posibles problemas con anticipación", pero la propuesta de arquitectura quedó abandonada en Jira
- Cuatro meses después, ese ingeniero se fue a un competidor con un aumento del 15%, fue reemplazado tras 3 meses de búsqueda y $47,000 en costos de contratación, y tomó 5 meses adicionales alcanzar la productividad
- Mientras tanto, otros 2 ingenieros senior se fueron: 1 por frustración con la deuda técnica y 1 por aceptar afuera un rol de Principal Engineer que no existía dentro de la empresa
- La advertencia inicial volvió a discutirse recién en una revisión de arquitectura 9 meses después
- Para entonces, ya se había perdido la memoria organizacional sobre el contexto de la propuesta y cómo resolverla
- Se le asignó a un ingeniero junior la tarea de "investigar alternativas"
- El mismo Black Friday, el desastre comenzó a las 9:47 a. m. cuando se dispararon las transacciones
- A las 10:23 a. m., la base de datos empezó a rechazar solicitudes de escritura
- El cuello de botella estaba exactamente en el punto señalado 14 meses antes, y la falla provocó $2.5M en transacciones que no pudieron procesarse
- La recuperación tomó 5 horas
- La expansión de infraestructura de emergencia costó $180,000 y 3 ingenieros trabajaron horas extra durante todo el feriado para hacer cambios permanentes de arquitectura
- El 3 de diciembre, se presentó a la dirección un postmortem liderado por el CTO con un nuevo apartado
- Se agregó una sección de “Previously Raised Concerns” que registró la advertencia inicial de ese ingeniero, la decisión de restarle prioridad y la posterior salida de personal
- El CFO calculó el costo total
- Costo de rotación de ingenieros (3 seniors): costo medible de $235,000 por persona
- Reclutamiento $47,000 + bono de firma $30,000 + costo de vacante $83,000 (promedio de 4 meses) + onboarding y ramp-up $75,000
- Total $705,000
- Costo por pérdida de conocimiento tribal: $2.2M
- La organización perdió el entendimiento sobre la estructura de la base de datos, los modos de falla y las soluciones previas
- Hubo que redescubrir el problema, reinvestigar la solución e implementarla en una situación de emergencia
- Esa brecha de conocimiento convirtió una migración planificada en una respuesta de crisis
- Se acumularon costos de investigación, intentos fallidos, incorporación urgente de proveedores y atención a comercios
- Costo de transacciones fallidas:
- $2.5M en pagos que no pudieron procesarse
- Como la comisión era de 2.9%, la pérdida directa de ingresos fue de $72,500, pero existía la obligación contractual de procesar todas las operaciones
- Por eso, el fallo de procesamiento generó una multa por incumplimiento de SLA de $180,000 y $45,000 en soporte a comercios y costos de retención
- Costo de infraestructura de emergencia: $180,000
- Escalamiento urgente de base de datos (réplicas de lectura adicionales, instancias mejoradas y costos de soporte acelerado del proveedor)
- Reconfiguración del load balancer y optimización de CDN para poder manejar el tráfico previsto 14 meses antes
- Costo de recuperación y acciones posteriores: $87,000
- 3 ingenieros senior trabajaron 72 horas del fin de semana feriado con una tasa de horas extra de 2.5x: $51,923
- 2 semanas de trabajo de seguimiento del equipo de ingeniería más amplio: $38,462
- Costo total del incidente: $3.47M
- Costo preventivo originalmente propuesto: $80,000 (incluyendo 6 semanas de trabajo de ingeniería de 1 ingeniero senior y costos de infraestructura)
- En la primera página del postmortem decía $3.47M vs $80,000, y ese número cambió el rumbo de la conversación
- El CEO ordenó un análisis de retención para responder a preguntas del directorio
- La tasa anual de salida de ingenieros senior era de 34% (más del doble del promedio del sector para empresas rentables)
- En las entrevistas de salida, antes archivadas sin revisión ejecutiva, apareció un patrón consistente
- Los ingenieros talentosos se iban cuando sus preocupaciones técnicas eran reconocidas, pero no ejecutadas
- Se implementaron 4 medidas de mejora durante 18 meses:
- El CFO empezó a seguir el costo de rotación en los reportes trimestrales junto con el costo de adquisición de clientes — de pronto, el costo promedio de salida de $235,000 apareció en documentos como si fuera una decisión de gasto de marketing
- Todos los ejecutivos participaron en una rotación trimestral de guardias on-call — la VP of Product que había bajado de prioridad el trabajo de base de datos recibió en su primera semana un informe de 23 páginas, de las cuales 19 trataban deuda técnica señalada en los 6 meses previos
- El comité de compensaciones agregó un componente de retención de talento a la remuneración variable de los ejecutivos: mantener al 90% de los ingenieros senior al año pasó a valer 25% del cálculo del bono
- Se crearon carreras de Staff y Principal IC alineadas en compensación con los niveles de director y VP
- Dieciocho meses después, la tasa anual de salida de ingenieros senior en esta empresa de pagos bajó a 9%
- Más importante aún, cambió el proceso de revisión de arquitectura:
- Las propuestas de deuda técnica ahora incluyen un costo calculado de falla
- Los ejecutivos preguntan de forma habitual: "Si aplazamos esto, ¿cuál es el riesgo de rotación de ingenieros?"
- El ingeniero de plataforma que originalmente había planteado la preocupación sobre la base de datos volvió como Principal Engineer
- Regresó con un salario 40% más alto que cuando se fue — contratado específicamente para liderar el escalamiento de infraestructura
- El regreso de ese ingeniero, junto con el cambio que mostraron los números, simboliza que el cálculo económico de la organización realmente cambió
Seis intervenciones que realmente funcionaron
-
Intervenciones estructurales que realinean los incentivos; no recolección de información ni actividades de empatía, sino rediseño económico
-
Jerarquía del impacto
- Las 6 intervenciones pueden parecer abrumadoras, pero la dificultad de implementación y el tiempo para crear valor no son iguales; el orden importa
- La forma de obtener resultados más rápido: intervenciones que solo requieren el mínimo consentimiento de la organización
- Contabilidad del costo de la rotación (#1): solo requiere aprobación del CFO y tiempo de un analista financiero
- Seguimiento de incidentes causados por advertencias ignoradas (#2): solo requiere cambios en el proceso de SRE. No se necesita presupuesto ni reorganización, solo documentación sistemática de postmortems
- Ambas pueden empezar en 30 días y aportan evidencia cuantificada para peleas más difíciles
- Intervenciones de mediano plazo: requieren cambio cultural, pero no reestructuración de compensaciones
- Rotación de guardias ejecutivas (#3): funciona cuando un ejecutivo vive directamente las consecuencias de posponer trabajo de mejora de infraestructura, y esa política se afianza de forma natural
- Consejo técnico asesor con autoridad (#5): funciona cuando la dirección realmente acepta que sus decisiones puedan ser revertidas, y los pilotos pequeños fracasan en pocos trimestres
- Calendario de implementación de 3-6 meses: porque requieren construir confianza, no solo cambiar una política
- Intervenciones estructurales: requieren aprobación de la junta o del comité de compensaciones, toman 6-12 meses, pero generan el cambio más profundo
- Incluir métricas de retención en el esquema de compensación (#4): cuando los bonos ejecutivos dependen de retener a ingenieros senior, la deuda técnica se vuelve estratégicamente importante de la noche a la mañana
- Garantizar paridad para la ruta IC (#6): cuando un Staff Engineer puede ganar salario de nivel ejecutivo sin gestionar equipos, retener expertise técnico se vuelve estructuralmente posible
- Intervención mínima viable: combinar dos elementos de capas distintas
- Contabilidad del costo de la rotación (resultado rápido) + métricas de retención en la compensación (cambio estructural)
- La primera construye el caso de negocio; la segunda hace racional que la dirección actúe
- Empresas en crisis: aplicar de inmediato resultados rápidos + diseñar en paralelo cambios estructurales
- Empresas con señales tempranas de alerta: empezar con medición (contabilidad de costos, seguimiento de incidentes) + usar los datos resultantes para justificar intervenciones más profundas
-
1. Contabilidad del costo de la rotación (Cost-of-Attrition Accounting)
- Hacer visible lo invisible: calcular el costo total de cada salida de un ingeniero senior
- Costo promedio de reclutamiento: $35,000
- Cerca de 6 meses para llegar a productividad plena (50% del salario anual de un ingeniero senior)
- Retrasos de proyectos por pérdida de conocimiento
- Costo de oportunidad de decisiones de arquitectura que solo ese ingeniero entendía
- Llevar estas cifras mes a mes e incluirlas en el mismo dashboard ejecutivo que CAC y métricas de ingresos
- Una empresa de servicios financieros rastreó el costo trimestral de la rotación y encontró que
- Q1: salida de 2 seniors, $400,000
- Q3: costo anual proyectado de $900,000
- Cuando el CFO lo presentó junto con el presupuesto anual de ingeniería de $3M
- La pregunta del CEO cambió de “¿por qué se fueron?” a “¿cuánto hace falta para evitarlo?”
- Como resultado, invirtieron $400,000 en reducir deuda técnica y ajustar compensaciones
la tasa de salida de seniors bajó 43% y la inversión se recuperó por completo en solo dos trimestres
- Hacer visible lo invisible: calcular el costo total de cada salida de un ingeniero senior
-
2. Rastrear incidentes provocados por advertencias ignoradas
- Modificar la plantilla de postmortem para agregar una sección obligatoria llamada "Advertencias previas (Prior Warnings)"
- Exigir que la persona responsable revise advertencias anteriores sobre ese modo de falla en Jira, Slack, notas de revisión de arquitectura y correo electrónico
- Elementos a documentar: cuándo se planteó la advertencia, quién la planteó, qué acción se propuso y por qué se le bajó la prioridad
- Calcular el costo del incidente: impacto en ingresos por downtime, carga sobre soporte al cliente y tiempo de ingeniería dedicado a la recuperación
- Una empresa de tecnología para salud implementó este enfoque y luego
- Descubrió que en 6 meses el 70% de los incidentes en producción habían sido anticipados
- Los ingenieros habían planteado sus preocupaciones, pero la dirección les bajó la prioridad para enfocarse en features
- Costo total en 1 año: 1.8 millones de dólares en incidentes evitables
- Cuando la dirección confirmó que en 14 de 16 fallas graves las advertencias técnicas habían sido correctas, entendió la gravedad del patrón
- Una vez demostrado que las predicciones eran consistentemente correctas, el comportamiento cambió
-
3. Rotación de guardias ejecutivas
- Todos los ejecutivos (incluyendo producto, VP y directores) hacen 1 semana de guardia por trimestre
- Política de escalamiento:
- Si el ingeniero de guardia determina que una alerta está relacionada con una corrección antes degradada de prioridad o con trabajo técnico pospuesto
- Debe reportarlo directamente a la persona responsable de esa decisión, sin importar la hora o el día
- Esto ofrece un aprendizaje experiencial más poderoso que cualquier dashboard
- Caso: un VP of Product recibió 17 llamadas en 5 días por el mismo problema del pool de conexiones a base de datos que los ingenieros habían marcado 7 meses antes como una corrección “sería bueno tener”
- Ese problema había sido clasificado como P3 y el VP priorizó en su lugar el lanzamiento de 3 features
- Después de 5 llamadas seguidas a las 3 a.m., lo recategorizó a P0 y se corrigió en 8 días
- Después, ese VP admitió: “Pensé que los ingenieros exageraban con la fatiga por alertas. No era así”
-
4. Incorporar métricas de retención de talento en la compensación ejecutiva
- Reestructurar la compensación variable de la dirección para que el 25% dependa de la retención de ingenieros senior
- Definición de “senior”: más de 2 años en la empresa, desempeño por encima de expectativas o responsabilidad sobre sistemas críticos
- Fijar la meta en 90% de retención anual de ingenieros senior
- Si no se cumple la meta, el bono se reduce proporcionalmente
- Si se supera la meta, el bono se multiplica
- Caso: una empresa SaaS en Series B implementó esta estructura en 2021
- Rotación anual de ingenieros senior: 28%
- Resistencia inicial de la dirección: “No podemos controlar que alguien reciba una mejor oferta”
- Respuesta del CEO: “Entonces estamos admitiendo que solo competimos con salario. Mejoren eso o acepten el impacto en la compensación”
- En 1 año, la rotación cayó a 11%
- El patrón en entrevistas de salida cambió: los ingenieros que se iban mencionaban salidas por oportunidad (ascenso a principal en una empresa más grande, fundar una startup, mudanza) y no salidas por disfunción (preocupaciones técnicas ignoradas, falta de crecimiento, cultura tóxica)
- Cuando la dirección pasó a tener responsabilidad real sobre la retención, cumplir las metas de bono se volvió la parte más fácil
-
5. Consejo técnico asesor (TAB) con poder real
- Formar un comité de 5 ingenieros senior elegidos por la organización de ingeniería, no nombrados por la dirección
- Reuniones trimestrales con los C-level
- Un poder: vetar 1 decisión ejecutiva por trimestre
- Requisito: si ejerce el veto, debe presentar una alternativa por escrito con justificación técnica, costo estimado y análisis de riesgos
- La dirección solo puede anular el veto con aprobación del CEO y una razón documentada
- Caso: una empresa de infraestructura blockchain creó el TAB a inicios de 2020
- En 2 años, ejerció el veto 2 veces
- Primer veto: bloqueó la decisión de construir un framework propietario de consenso y propuso en su lugar extender un protocolo open source existente. Se estimó un ahorro de 18 meses de desarrollo
- Segundo veto: evitó lanzar una migración de base de datos sin pruebas integrales de rollback. Un análisis posterior estimó que el TAB previno un incidente de corrupción de datos de $2 millones
- El impacto real fue más sutil: la dirección empezó a preguntarse “¿el TAB aprobaría esto?” antes de cerrar decisiones técnicas
- La amenaza del veto cambió la calidad de las propuestas antes de llegar al TAB
- Los ingenieros reportaron que su criterio técnico finalmente había empezado a importar en las decisiones ejecutivas
-
6. Ruta IC (contribuidor individual) con paridad de compensación
-
Establecer con claridad la ruta de desarrollo profesional IC: Staff Engineer, Principal Engineer, Distinguished Engineer
- Las bandas de compensación deben alinearse con niveles de Director, VP y SVP, respectivamente
-
Criterios de promoción: impacto técnico, liderazgo de arquitectura y efecto multiplicador sobre la efectividad de otros ingenieros, más que tamaño de equipo o estructura de reportes
-
Caso: una empresa fintech perdió 3 ingenieros de nivel Staff en 6 meses
-
En las entrevistas de salida aparecía el mismo patrón: "sin convertirse en gerente, no se puede llegar a una compensación de nivel L7. No quiero gestionar; quiero seguir siendo desarrollador"
- La empresa implementó una trayectoria IC con paridad salarial
- En menos de un año: 2 ingenieros que antes estaban entrevistándose fueron promovidos a Principal, se contrató a 3 IC senior de la competencia que no ofrecía una trayectoria profesional similar, y la fuga de talento técnico senior se redujo en 62%
- Más importante aún, los ingenieros que se quedaron en la empresa evitaron errores de arquitectura estimados en 3 millones de dólares
- Se trataba de decisiones a las que los ingenieros junior o mid-level no podían oponerse por falta de experiencia o autoridad
Rutas de implementación (Implementation Paths)
- El calendario de implementación varía según la gravedad de la situación de la organización
-
Empresa en crisis (tasa de salida de seniors >20%, incidente grave reciente)
- Semanas 1-2: calcular el costo real de rotación de 12 meses (incluyendo costos de contratación, tiempo de adaptación productiva, retrasos de proyectos y pérdida de conocimiento faltante), analizar patrones en entrevistas de salida, mapear incidentes de producción con advertencias previamente ignoradas
- Semanas 3-4: presentar hallazgos al CFO y al CEO, mostrar el patrón (planteamiento de preocupación técnica → baja de prioridad → salida de ingenieros → incidente o costo), cuantificar la pérdida total, proponer intervención inmediata
- Semanas 5-8: iniciar la rotación de guardia ejecutiva (el cambio cultural más rápido), comenzar el seguimiento del costo de rotación (para construir el caso de cambio continuo), crear un piloto de TAB con 3 ingenieros, comenzar el seguimiento mensual del costo de rotación en el dashboard ejecutivo
- Semanas 9-12: presentar a la junta cambios en la estructura de compensación, vincular los bonos ejecutivos a la retención, anunciar públicamente la ruta de carrera IC, comunicar con transparencia qué cambió y por qué
-
Empresa con señales tempranas de alerta (tasa de salida de 12-18%, ingenieros mencionan preocupaciones en 1:1)
- Meses 1-2: comenzar a rastrear el costo de rotación y construir el caso económico, encuestar a ingenieros sobre riesgo de salida y qué los haría quedarse, identificar las 3 preocupaciones mencionadas con mayor frecuencia
- Meses 3-4: piloto de ejecutivo de recursos y rotación de guardia ejecutiva, iniciar piloto de TAB, usar ambos para hacer visibles la deuda técnica y la fricción organizacional, documentar el costo del trabajo diferido
- Meses 5-6: implementar cambios permanentes en la estructura de compensación, formalizar la autoridad del TAB, publicar criterios de la ruta de carrera IC y bandas salariales, establecer la retención de ingenieros senior como objetivo ejecutivo explícito
Cuando esto no funciona
- Estas intervenciones fracasan de forma predecible en 3 escenarios, y no reconocerlo solo hace perder tiempo
-
1. Un modelo de negocio diseñado desde el inicio asumiendo rotación
- Las consultoras y contratistas esperan una rotación anual de 20-40%
- El modelo de negocio incorpora en el precio el costo de reemplazar personal, y las tarifas de cobro se fijan bajo la premisa de que el conocimiento especializado dentro de la organización es limitado
- Las estrategias de retención diseñadas para empresas de producto no tienen sentido donde la rotación de clientes impulsa una salida natural y la ruta a socio crea intencionalmente presión de up-or-out
- De forma similar, las startups tempranas antes de lograr product-market fit pueden experimentar salida de ingenieros que no señala un fracaso de retención, sino un pivote necesario
- Si la empresa cambia de dirección de forma fundamental cada 6 meses, una baja retención puede significar una reasignación adecuada de talento, no una disfunción sistémica
-
2. Cuando solo aparentan ejecutar (Implementation Theater)
- Las intervenciones meramente formales producen resultados peores que no intervenir
- Un TAB sin poder real de veto se convierte en una válvula de escape para dispersar las preocupaciones de los ingenieros
- Si invierten tiempo en propuestas que son ignoradas sistemáticamente, solo crece el enojo
- La rotación de guardia ejecutiva desconectada de resolver las causas de fondo genera empatía performativa sin responsabilidad
- Un VP que recibe llamadas por problemas que no puede priorizar ni resolver solo aprende que los ingenieros se quejan con frecuencia
- La contabilidad del costo de rotación que se calcula, pero nunca aparece en dashboards ejecutivos ni en discusiones de compensación, queda como una discusión teórica
- Las intervenciones implementadas a medias muestran que el liderazgo solo finge interés sin voluntad real de cambio estructural
-
3. Ausencia de prerrequisitos culturales
- Estas intervenciones requieren prerrequisitos culturales ausentes en muchas organizaciones: el liderazgo debe querer cambio real de comportamiento, no gestión de reputación
- Si la dirección ve la retención de ingenieros como un problema de PR y no como un problema económico, aplicará solo las intervenciones más visibles (consejos asesores, giras de escucha) mientras evita las costosas (reestructuración de compensación, poder de veto real)
- Prueba diagnóstica: proponer vincular el 25% de la compensación variable de los ejecutivos a la retención de ingenieros senior
- Si el liderazgo responde de inmediato con “por qué eso no funciona en nuestra empresa”, ya encontraste la respuesta
- Quieren una solución sin costo personal
- Si el liderazgo responde de inmediato con “por qué eso no funciona en nuestra empresa”, ya encontraste la respuesta
- Una empresa que no está lista para dar poder de veto a ingenieros, vincular el salario ejecutivo a la retención e incorporar el costo de rotación en las revisiones financieras trimestrales no está lista para el cambio estructural
- Solo se conformará con reportes de consultoría que juntan polvo mientras reconoce las preocupaciones, recomienda “más investigación” y los ingenieros senior siguen yéndose
- Las intervenciones funcionan cuando el liderazgo reconoce que un costo anual de rotación de 1.4 millones de dólares es mayor que las medidas necesarias para evitarlo
- Sin ese reconocimiento, ningún consejo asesor puede sustituir la alineación económica
Un nuevo cálculo económico
- La empresa de infraestructura blockchain que dirigió el autor creció en 3 años de 10 a 187 ingenieros y aun así
- mantuvo una tasa anual de salida de ingenieros senior de 6% en promedio, muy por debajo del 35~40% típico en empresas de hipercrecimiento
- La causa del resultado no estuvo en beneficios ni mecanismos culturales, sino en el rediseño de la estructura de incentivos
- Los mandos medios eran recompensados por hacer visibles temprano los riesgos técnicos, no por aparentar que todo estaba bajo control
- Los postmortems exigían documentar advertencias previas; las advertencias ignoradas pasaban a formar parte de la evaluación de desempeño de quien las había relegado en prioridad
- El liderazgo técnico tenía poder de veto sobre decisiones de arquitectura. Lo usamos 2 veces, y la sola posibilidad de ejercer ese veto mejoró la calidad general de las propuestas
- La ruta de carrera IC existía desde la fundación; el contribuidor individual no gerente más senior ganaba más que la mayoría de los directores
- Costo del sistema: alrededor de $400,000 al año en ajustes de compensación, overhead de gobernanza y priorización de deuda técnica que retrasó algunas funciones
- Ahorros:
- 2.1 millones de dólares en costos de rotación evitados (aplicando el estándar de la industria de 35% de rotación al número de ingenieros senior)
- Además, hubo ahorros imposibles de medir pero sustanciales en decisiones de arquitectura que no provocaron incidentes de millones de dólares gracias a que los ingenieros senior tenían autoridad para detenerlas
La verdad incómoda
- La mayoría de las empresas no implementa estas intervenciones hasta que se ve forzada por una situación inevitable
- Esa fuerza suele ser catastrófica: un incidente de producción que cuesta millones, una fuga masiva de personal que paraliza a un equipo clave, o un competidor que se lleva a la mitad de tu núcleo de ingenieros ofreciéndoles lo que tú rechazaste, es decir, respeto por el criterio técnico
- Para entonces, ya no estarás previniendo, sino tratando de reparar el daño
- Recuperarse es costoso. Los mejores ingenieros capaces de prevenir la siguiente crisis ya se fueron
- Sus reemplazos pueden ser talentosos, pero carecen del conocimiento organizacional para saber qué advertencias hacer, y aceleran el loop de destrucción
- La pregunta no es si estas intervenciones funcionan; la evidencia es clara
- Las empresas que alinean los incentivos ejecutivos con la retención, dan autoridad significativa a los ingenieros y tratan la rotación como un problema económico obtienen consistentemente mejores resultados en retención, tasa de incidentes y salud técnica de largo plazo
- Si los ingenieros con experiencia se están yendo y las soluciones habituales no funcionan, el problema puede no ser de comunicación, sino de economía
10 comentarios
La dirección escucha esto y asiente con la cabeza
Reconoce el problema
Dice que va a reajustar las prioridades
> Aquí es donde me trabo
Verdad incómoda +
Aunque lean este artículo, los ejecutivos que realmente tienen que tomar la decisión no lo van a entender.
Estoy de acuerdo.
Totalmente cierto
Es realmente valioso ver un texto que sí propone soluciones. Gracias.
Lo estoy viendo en móvil y parece un problema de alineación: hay varias listas en el cuerpo donde en una línea solo aparece una letra. Además de eso, apenas hay un poco de profundidad, el ancho de las líneas se vuelve dramáticamente corto.
Lo corregí. Gracias por avisar.
Sí, en iOS 26.1 x Safari también presenta el mismo síntoma.
Yo también quiero hacer refactoring.
Muéstrame el incentivo y te mostraré el resultado. - Charlie Munger