El COO de Uber dice que cada vez es más difícil justificar el dinero gastado en tokenmaxxing
(businessinsider.com)- El COO de Uber considera que cada vez es más difícil justificar si el gasto en IA está generando resultados proporcionales al costo invertido
- La discusión interna creció después de que el CTO de Uber revelara que ya se había agotado el presupuesto de Claude Code para 2026
- Aún no se ha confirmado el vínculo de que un mayor uso de tokens se traduzca proporcionalmente en más funciones útiles para consumidores
- El CEO de Uber señaló que la empresa está desacelerando las contrataciones para compensar la inversión en IA
- A diferencia de la tendencia de tokenmaxxing en Big Tech, Duolingo dio marcha atrás a su decisión de incorporar el uso de IA en la evaluación de desempeño tras la reacción de sus empleados
El problema de justificar los costos de IA dentro de Uber
- El director de operaciones de Uber, Andrew Macdonald, cree que cada vez es más difícil justificar los costos de IA dentro de la empresa
- En una entrevista de Rapid Response publicada el sábado, dijo que la IA no está generando un impacto equivalente al dinero que la empresa está gastando
- La discusión interna aumentó después de que el CTO de Uber, Praveen Neppalli Naga, dijera en una entrevista con The Information en abril que Uber ya se había gastado todo su presupuesto de Claude Code para 2026
- Esa declaración llevó a una situación que Macdonald describió como un “momento en que te explota la cabeza”, y dentro de la empresa se discutió el equilibrio entre el consumo de tokens de IA y el tamaño de la plantilla
Falta de conexión entre el uso de tokens y el rendimiento del producto
- Tras hablar con líderes senior de ingeniería de Uber, Macdonald concluyó que un mayor uso de tokens no se traduce en un aumento proporcional de funciones útiles para consumidores
- Con la expresión “esa conexión aún no existe”, sostuvo que quizá sí se estén lanzando más funciones, pero que es difícil vincular directamente una métrica específica con la conclusión de que “ahora realmente estamos creando 25% más funciones útiles para consumidores”
- Mientras más difícil sea conectar el gasto en IA directamente con resultados, más difícil será justificar el costo de oportunidad de ese intercambio
- El CEO Dara Khosrowshahi dijo a principios de este mes, durante la presentación de resultados, que Uber está desacelerando las contrataciones para compensar su inversión en IA
Para los usuarios parece gratis, pero la empresa asume el costo
- Macdonald considera que la IA puede parecer gratuita si quien imagina “casos de uso interesantes” es un usuario que no tiene que pagar el costo
- Pero al final, la empresa es la que paga
- La expansión del uso de IA no se trata solo como un experimento de productividad, sino como una estructura de costos que afecta el presupuesto y la gestión de personal
Una tendencia distinta al tokenmaxxing de Big Tech
- Big Tech está empujando con fuerza el tokenmaxxing, es decir, usar IA tanto como sea posible, y algunas empresas reflejan el nivel de uso de IA de sus empleados en sus evaluaciones
- Meta, Google y JPMorgan son mencionadas como empresas que vinculan el uso de IA con evaluaciones de desempeño, objetivos, aumentos salariales y ascensos
- En cambio, algunas compañías están empezando a alejarse de la estrategia de imponer el uso de IA como fin en sí mismo
- Duolingo dio marcha atrás a su decisión de incluir el uso de IA en las evaluaciones de desempeño después de que empleados preguntaran: “¿Tenemos que usar IA solo por usar IA?”
- En una entrevista para un pódcast en abril, el CEO de Duolingo, Luis von Ahn, dijo que más que exigir responsabilidad por resultados reales, en algunos casos se sentía como empujar a la fuerza algo que simplemente no encajaba
1 comentarios
Comentarios de Hacker News
En 2007~2009, cuando Google estaba ampliando mucho sus centros de datos, había mucha capacidad ociosa, especialmente fuera del horario laboral
Cualquier ingeniero podía ejecutar todo lo que quisiera con prioridad 0, y si un trabajo más importante necesitaba recursos, era lo primero que se mataba
Se hacían muchos experimentos de MapReduce durante la noche, y por un tiempo incluso se operaron servicios internos con prioridad 0, casi como si fueran “gratis”
A medida que creció el uso, esos servicios se fueron volviendo cada vez más inestables, y al final hubo que justificar el uso de recursos o reducir su escala, pero me parece que eso fue algo positivo
El uso de tokens para IA podría seguir un modelo parecido. Las grandes tecnológicas pueden tener sus propios centros de datos para LLM, cubrir la demanda interna y luego abrir la capacidad ociosa fuera del horario laboral para experimentos de los empleados
En el trabajo diario, habría que fomentar más la eficiencia de tokens que la cantidad de tokens en sí. Gastar muchos tokens en una automatización que ahorra varias horas de trabajo humano cada semana es un buen uso; gastar muchos tokens para depurar un bug sencillo de frontend que se puede corregir a mano y aun así tardar 4 horas es un desperdicio
https://developers.openai.com/api/docs/guides/batch
En enfoques como el desarrollo guiado por especificaciones, donde la persona no está dentro del loop sino supervisándolo desde arriba, este enfoque resulta mucho más natural, pero al menos por mi experiencia con frontends de Google, todavía no he visto que se soporte bien
Lo que está pasando ahora era obvio para mucha gente. Es como decirle “consume con un poco más de cuidado” a un nuevo adicto creado a propósito para que se vuelva dependiente, así que probablemente no funcione muy bien
No me gusta usar IA y tampoco siento que me ayude mucho
Pero como la empresa obliga a usarla y rastrea las métricas, todos los días le lanzo tareas basura sin sentido para que parezca que sí la uso
Aunque termine creando más problemas de los que resuelve, en las métricas aparezco como alguien que sí usa IA
Si cualquier empresa anuncia que usa el consumo de tokens como señal de desempeño de los empleados, para mí eso ya es casi una señal de alerta para evitarla
Una empresa con buen liderazgo de ingeniería no debería tratar esto como si fuera una idea aceptable
Pero si desperdicias 500 dólares en tokens de IA de forma improductiva, en la empresa te reconocen como uno de los mayores adoptantes de IA
En algunas empresas incluso les dicen a los desarrolladores que “preferirían que ya no escribieran ni una sola línea de código por su cuenta”
Desde la perspectiva ejecutiva, probablemente la lógica sea algo así: si el 20% superior de los empleados produce el 80% del código con LLM y la empresa sigue funcionando, entonces pueden recortar al 80% inferior de desarrolladores para ahorrar costos
Usar el uso de tokens para evaluar el desempeño del personal es solo una de ellas
No hay mucho realmente nuevo bajo el enorme reactor de fusión del cielo
Leí sobre algo parecido al tokenmaxxing en la industria del telégrafo en “The Information” de James Gleick
Como los telegramas se cobraban por carácter, existía un gran mercado de libros de códigos para reducir la cantidad de caracteres enviados. La compresión era dinero, y a las compañías telegráficas no les gustaba, pero no tuvieron más remedio que aceptarla
La industria de códigos telegráficos existió desde los inicios de la comercialización del telégrafo hasta la década de 1920
Pero también tenía un costo. Los códigos reducían muchísimo la redundancia, y un error muy pequeño podía causar grandes malentendidos
Según explica Gleick, eso era justo lo opuesto a cómo los tambores africanos añadían redundancia para reforzar la relación entre el ritmo y el lenguaje que los tambores imitaban
O sea, ganaría quien más tokens quemó o más costo generó, no el programador que entregó funcionalidad
Lo que describiste no se parece a maximizar tokens, sino más bien a minimizar tokens
Siempre me he preguntado esto sobre los stacks de software desde antes de los LLM, pero ahora parece aún más relevante
¿Cuándo queda “terminada” una empresa como Uber? Llevan 16 años haciendo software
Es una empresa que conecta conductores con pasajeros, y por más software que hagan, no aumenta mucho la probabilidad de que yo elija Uber en vez de un autobús o un tren
¿Dentro de 20 años se acabará el software? ¿O dentro de 80?
También hay que contar el entorno regulatorio cambiante y los productos nuevos. Basta ver cuándo apareció Uber Eats
En esos 16 años apareció el Covid-19, surgió la conducción autónoma práctica y también la alianza con Waymo
Una app conectada en red para el público masivo nunca puede quedar “terminada” salvo que exista una capacidad de predicción perfecta
El stack tecnológico interno es como un organismo vivo, y mantener un servicio que por fuera parece no cambiar también requiere muchísimo trabajo. Escalar también es un reto enorme, y escalabilidad y mantenimiento se retroalimentan constantemente
Cada país tiene sus propias leyes sobre lo que Uber puede y no puede hacer, y eso hay que formalizarlo en código
Por ejemplo, en algunos lugares en realidad pides un taxi a través de la app de Uber, y la tarifa puede calcularse por milla en lugar de ser un monto fijo por adelantado
A eso se suman las leyes de cada ciudad. Si tomas un Uber desde el pueblo A, donde la ley es una, hasta el pueblo B, donde la ley es otra, ¿qué se supone que debe pasar? Los abogados sabrán la respuesta, pero la app tiene que cumplirla
Además, las leyes cambian todo el tiempo
Y la optimización nunca se acaba. Siempre hay algo que mejorar: velocidad, costo, rutas, etc.
Como consumidor, uno solo ve una fracción muy pequeña de toda la complejidad que un servicio así tiene que construir y operar
Y casi siempre hay bugs que corregir. Muchísimos bugs, de hecho
También es un problema propio de una empresa que recibió una inversión enorme. El valor de Uber se basa menos en lo que hace hoy y más en la expectativa de que volverá obsoleta la idea de tener auto propio o usar transporte público
Es una exageración, pero aun así es menos exagerado de lo que parece
El tokenmaxxing no tiene sentido. Es como escribir a propósito jobs ineficientes de SQL/Spark para usar la mayor cantidad posible de cómputo, memoria y E/S
Es como meter a propósito un montón de cosas como productos cartesianos y datasets extremadamente sesgados
Cuando una métrica se convierte en objetivo, esto siempre pasa. Las empresas deberían fomentar un entorno donde la IA se use de la manera más eficiente posible, y primero preguntar: “¿de verdad esta tarea necesita un agente?”
Si la respuesta es sí, entonces hay que decidir qué tipo de agente, qué modelo y qué nivel de razonamiento se necesita
También habría que incentivar el ahorro de tokens, aumentar el cache hit rate y estructurar mejor la información para poder usarla con menos contexto. Los grafos de conocimiento funcionan bastante bien para esto
Es como incendiar una gasolinera para ganar una carrera
Es solo una manera de empujar o forzar a todos a experimentar con una tecnología nueva
Una vez que consideren que todo el mundo ya está usando IA, cosas como el tokenmaxxing naturalmente desaparecerán
He visto muchos casos de uso donde es dudoso que se esté generando valor, pero también he visto equipos que resolvieron problemas antiguos con flujos de trabajo tipo agente que habría sido difícil justificar frente a un comité de revisión de costos
Entiendo que el ahorro de tokens, el aumento del cache hit rate y el trabajo de estructuración de información para usar menos contexto suelen llevarlos por detrás equipos aparte en la mayoría de las grandes empresas de tokenmaxxing
Entiendo que las empresas estén quemando dinero en desarrollo asistido por IA. Pero, ¿qué pasa con el retorno de inversión total? ¿Realmente ha valido lo que dicen en términos de mejora de eficiencia?
Este es el único punto realmente interesante de la fiebre de la IA, y no entiendo por qué nadie lo está discutiendo
Puedes usar Claude para crear 5 funciones inútiles o malas en un día, o 1 función útil en dos días. ¿Cuál de las dos tiene mejor impacto en el retorno de inversión?
Viéndolo solo como ejemplo parece una pregunta fácil, pero en la realidad es muchísimo más matizado y mucho más difícil de medir
Por eso parece que muchas empresas simplemente renuncian a medir y eligen el camino fácil de seguir el hype
Estoy convencido de que, usándola bien e incluyendo code review, la mejora máxima sostenible con IA para productividad de ingeniería, en el caso de un ingeniero senior con la experiencia adecuada, es de alrededor de 20%
Ningún presupuesto de tokens para un ingeniero debería pasar de eso
No creo que un ingeniero que hace tokenmaxxing sea realmente productivo, y no he visto absolutamente ninguna evidencia de ello. Si acaso, podría ser más bien lo contrario
Con el flujo correcto y conocimiento del codebase, personalmente sí he sentido que ese nivel es posible con un esfuerzo sostenible
Parece que la IA para productividad en ingeniería se malinterpreta ampliamente como un botón mágico que entrega el mismo resultado más rápido y más barato
Bajo esa lógica, es natural querer obligar a los empleados a hacer tokenmaxxing. Si puedes obtener más resultados, más rápido y más barato, ¿por qué no hacerlo?
Visto con más matices, la realidad es esta: la IA sí ayuda a avanzar un roadmap algo más rápido, pero genera deuda técnica parecida a contratar desarrolladores temporales para construir funciones
Tampoco es seguro que aparezca dentro del equipo alguien que realmente entienda el código nuevo
Del mismo modo, también se reduce el desarrollo de habilidades de los miembros junior del equipo. Es más difícil extraer como antes el arbitraje entre habilidad y salario
El producto también puede volverse más complejo. Si una función es P2, es por algo, pero la IA puede hacer que se incluyan funciones de bajo beneficio marginal y eso complique el producto
Me impacta que alguien haya creído que el tokenmaxxing era una buena idea
Los maximalistas de la IA suelen comparar esta tecnología con la electricidad. Imaginen que, en los inicios de la electrificación, un CEO hubiera recompensado a sus empleados por aumentar el consumo de electricidad en lugar de encontrar formas de usarla para mejorar el negocio
En esa época era común internar en instituciones a personas que mostraban señales de trastornos mentales, así que probablemente algo así habría terminado de esa manera