El COO de Uber dice que cada vez es más difícil justificar el dinero gastado en tokenmaxxing

(businessinsider.com)

4 puntos por GN⁺ 2026-05-27 | 3 comentarios | Compartir por WhatsApp

El COO de Uber considera que cada vez es más difícil justificar si el gasto en IA está generando resultados proporcionales al costo invertido
La discusión interna creció después de que el CTO de Uber revelara que ya se había agotado el presupuesto de Claude Code para 2026
Aún no se ha confirmado el vínculo de que un mayor uso de tokens se traduzca proporcionalmente en más funciones útiles para consumidores
El CEO de Uber señaló que la empresa está desacelerando las contrataciones para compensar la inversión en IA
A diferencia de la tendencia de tokenmaxxing en Big Tech, Duolingo dio marcha atrás a su decisión de incorporar el uso de IA en la evaluación de desempeño tras la reacción de sus empleados

El problema de justificar los costos de IA dentro de Uber

El director de operaciones de Uber, Andrew Macdonald, cree que cada vez es más difícil justificar los costos de IA dentro de la empresa
En una entrevista de Rapid Response publicada el sábado, dijo que la IA no está generando un impacto equivalente al dinero que la empresa está gastando
La discusión interna aumentó después de que el CTO de Uber, Praveen Neppalli Naga, dijera en una entrevista con The Information en abril que Uber ya se había gastado todo su presupuesto de Claude Code para 2026
Esa declaración llevó a una situación que Macdonald describió como un “momento en que te explota la cabeza”, y dentro de la empresa se discutió el equilibrio entre el consumo de tokens de IA y el tamaño de la plantilla

Falta de conexión entre el uso de tokens y el rendimiento del producto

Tras hablar con líderes senior de ingeniería de Uber, Macdonald concluyó que un mayor uso de tokens no se traduce en un aumento proporcional de funciones útiles para consumidores
Con la expresión “esa conexión aún no existe”, sostuvo que quizá sí se estén lanzando más funciones, pero que es difícil vincular directamente una métrica específica con la conclusión de que “ahora realmente estamos creando 25% más funciones útiles para consumidores”
Mientras más difícil sea conectar el gasto en IA directamente con resultados, más difícil será justificar el costo de oportunidad de ese intercambio
El CEO Dara Khosrowshahi dijo a principios de este mes, durante la presentación de resultados, que Uber está desacelerando las contrataciones para compensar su inversión en IA

Para los usuarios parece gratis, pero la empresa asume el costo

Macdonald considera que la IA puede parecer gratuita si quien imagina “casos de uso interesantes” es un usuario que no tiene que pagar el costo
Pero al final, la empresa es la que paga
La expansión del uso de IA no se trata solo como un experimento de productividad, sino como una estructura de costos que afecta el presupuesto y la gestión de personal

Una tendencia distinta al tokenmaxxing de Big Tech

Big Tech está empujando con fuerza el tokenmaxxing, es decir, usar IA tanto como sea posible, y algunas empresas reflejan el nivel de uso de IA de sus empleados en sus evaluaciones
Meta, Google y JPMorgan son mencionadas como empresas que vinculan el uso de IA con evaluaciones de desempeño, objetivos, aumentos salariales y ascensos
En cambio, algunas compañías están empezando a alejarse de la estrategia de imponer el uso de IA como fin en sí mismo
Duolingo dio marcha atrás a su decisión de incluir el uso de IA en las evaluaciones de desempeño después de que empleados preguntaran: “¿Tenemos que usar IA solo por usar IA?”
En una entrevista para un pódcast en abril, el CEO de Duolingo, Luis von Ahn, dijo que más que exigir responsabilidad por resultados reales, en algunos casos se sentía como empujar a la fuerza algo que simplemente no encajaba

3 comentarios

roxie 21 일 전

Visto en retrospectiva, al final todo está avanzando hacia una situación en la que las empresas están apretándose el cinturón con los tokens.

colus001 2026-05-27

Tokenmaxxing me parece algo bastante extraño. Eso de que mientras más combustible consume un camión, mejor, no sé qué se supone que significa. Me da la impresión de que Jensen Huang los terminó embaucando.

GN⁺ 2026-05-27

Comentarios de Hacker News

En 2007~2009, cuando Google estaba ampliando mucho sus centros de datos, había mucha capacidad ociosa, especialmente fuera del horario laboral
Cualquier ingeniero podía ejecutar todo lo que quisiera con prioridad 0, y si un trabajo más importante necesitaba recursos, era lo primero que se mataba
Se hacían muchos experimentos de MapReduce durante la noche, y por un tiempo incluso se operaron servicios internos con prioridad 0, casi como si fueran “gratis”
A medida que creció el uso, esos servicios se fueron volviendo cada vez más inestables, y al final hubo que justificar el uso de recursos o reducir su escala, pero me parece que eso fue algo positivo
El uso de tokens para IA podría seguir un modelo parecido. Las grandes tecnológicas pueden tener sus propios centros de datos para LLM, cubrir la demanda interna y luego abrir la capacidad ociosa fuera del horario laboral para experimentos de los empleados
En el trabajo diario, habría que fomentar más la eficiencia de tokens que la cantidad de tokens en sí. Gastar muchos tokens en una automatización que ahorra varias horas de trabajo humano cada semana es un buen uso; gastar muchos tokens para depurar un bug sencillo de frontend que se puede corregir a mano y aun así tardar 4 horas es un desperdicio
- ¿No se parece a lo de procesamiento por lotes de OpenAI? Las solicitudes se procesan dentro de 24 horas y cuestan la mitad
  https://developers.openai.com/api/docs/guides/batch
- No creo que los usuarios de LLM vayan a actuar de forma tan lógica. Parece que bastantes insisten en lanzar Opus a cualquier tarea trivial
- La mayoría de los frontends de IA están diseñados para trabajo interactivo, así que dificultan definir tareas de prioridad 0 que pueden completarse en cualquier momento
  En enfoques como el desarrollo guiado por especificaciones, donde la persona no está dentro del loop sino supervisándolo desde arriba, este enfoque resulta mucho más natural, pero al menos por mi experiencia con frontends de Google, todavía no he visto que se soporte bien
- Eso de evitar que la gente gaste muchos tokens y aun así tarde 4 horas en un bug sencillo de frontend no parece fácil
  Lo que está pasando ahora era obvio para mucha gente. Es como decirle “consume con un poco más de cuidado” a un nuevo adicto creado a propósito para que se vuelva dependiente, así que probablemente no funcione muy bien
- Al final, me parece más probable que todos terminen aceptando modelos chinos 10 veces más baratos
No me gusta usar IA y tampoco siento que me ayude mucho
Pero como la empresa obliga a usarla y rastrea las métricas, todos los días le lanzo tareas basura sin sentido para que parezca que sí la uso
Aunque termine creando más problemas de los que resuelve, en las métricas aparezco como alguien que sí usa IA
Si cualquier empresa anuncia que usa el consumo de tokens como señal de desempeño de los empleados, para mí eso ya es casi una señal de alerta para evitarla
Una empresa con buen liderazgo de ingeniería no debería tratar esto como si fuera una idea aceptable
- Si te pasas de 100 dólares en viáticos de comida, tienes que tener una conversación incómoda con tu gerente o con finanzas
  Pero si desperdicias 500 dólares en tokens de IA de forma improductiva, en la empresa te reconocen como uno de los mayores adoptantes de IA
- Tal vez sorprenda, pero conozco a varios desarrolladores de grandes tecnológicas muy conocidas, aunque no sean FAANG, y todos tienen alguna forma de ranking de tokens
  En algunas empresas incluso les dicen a los desarrolladores que “preferirían que ya no escribieran ni una sola línea de código por su cuenta”
  Desde la perspectiva ejecutiva, probablemente la lógica sea algo así: si el 20% superior de los empleados produce el 80% del código con LLM y la empresa sigue funcionando, entonces pueden recortar al 80% inferior de desarrolladores para ahorrar costos
- Incluso empresas que antes tenían un liderazgo razonable empezaron a apresurarse y a tomar decisiones dudosas después de la aparición de la IA con LLM
  Usar el uso de tokens para evaluar el desempeño del personal es solo una de ellas
- Los tokens son las nuevas líneas de código por ingeniero. Es fácil ponerlos en una gráfica y también “gestionarlos”
- Meta hace esto. Basta con imaginar cuál habrá sido uno de los criterios en sus despidos recientes
No hay mucho realmente nuevo bajo el enorme reactor de fusión del cielo
Leí sobre algo parecido al tokenmaxxing en la industria del telégrafo en “The Information” de James Gleick
Como los telegramas se cobraban por carácter, existía un gran mercado de libros de códigos para reducir la cantidad de caracteres enviados. La compresión era dinero, y a las compañías telegráficas no les gustaba, pero no tuvieron más remedio que aceptarla
La industria de códigos telegráficos existió desde los inicios de la comercialización del telégrafo hasta la década de 1920
Pero también tenía un costo. Los códigos reducían muchísimo la redundancia, y un error muy pequeño podía causar grandes malentendidos
Según explica Gleick, eso era justo lo opuesto a cómo los tambores africanos añadían redundancia para reforzar la relación entre el ritmo y el lenguaje que los tambores imitaban
- ¿No es exactamente lo contrario de tokenmaxxing? Si seguimos la analogía del telégrafo, la situación tendría que ser que al telegrafista lo evaluaran no por el volumen de clientes atendidos, sino por cuánto tiempo ocupó la línea telegráfica en un día
  O sea, ganaría quien más tokens quemó o más costo generó, no el programador que entregó funcionalidad
  Lo que describiste no se parece a maximizar tokens, sino más bien a minimizar tokens
- Interesante, pero tokenmaxxing no consiste en maximizar la eficiencia del uso de tokens, sino el uso mismo
- Lo que describiste es, en esencia, lo contrario de tokenmaxxing
Siempre me he preguntado esto sobre los stacks de software desde antes de los LLM, pero ahora parece aún más relevante
¿Cuándo queda “terminada” una empresa como Uber? Llevan 16 años haciendo software
Es una empresa que conecta conductores con pasajeros, y por más software que hagan, no aumenta mucho la probabilidad de que yo elija Uber en vez de un autobús o un tren
¿Dentro de 20 años se acabará el software? ¿O dentro de 80?
- La mayor parte del codebase es integración personalizada por mercado local. Algunas partes se pueden sistematizar, pero ahí es de donde sale la mayor parte de la complejidad
- Tal vez sería más fácil si el navegador, Android e iOS se quedaran congelados por más de 16 años
  También hay que contar el entorno regulatorio cambiante y los productos nuevos. Basta ver cuándo apareció Uber Eats
  En esos 16 años apareció el Covid-19, surgió la conducción autónoma práctica y también la alianza con Waymo
  Una app conectada en red para el público masivo nunca puede quedar “terminada” salvo que exista una capacidad de predicción perfecta
  El stack tecnológico interno es como un organismo vivo, y mantener un servicio que por fuera parece no cambiar también requiere muchísimo trabajo. Escalar también es un reto enorme, y escalabilidad y mantenimiento se retroalimentan constantemente
- Creo que se está subestimando lo complejo que es operar y optimizar a nivel internacional
  Cada país tiene sus propias leyes sobre lo que Uber puede y no puede hacer, y eso hay que formalizarlo en código
  Por ejemplo, en algunos lugares en realidad pides un taxi a través de la app de Uber, y la tarifa puede calcularse por milla en lugar de ser un monto fijo por adelantado
  A eso se suman las leyes de cada ciudad. Si tomas un Uber desde el pueblo A, donde la ley es una, hasta el pueblo B, donde la ley es otra, ¿qué se supone que debe pasar? Los abogados sabrán la respuesta, pero la app tiene que cumplirla
  Además, las leyes cambian todo el tiempo
  Y la optimización nunca se acaba. Siempre hay algo que mejorar: velocidad, costo, rutas, etc.
  Como consumidor, uno solo ve una fracción muy pequeña de toda la complejidad que un servicio así tiene que construir y operar
- Siempre hay tecnologías y técnicas nuevas que implementar. Se necesitan mejores algoritmos, despliegues más grandes y mayor confiabilidad
  Y casi siempre hay bugs que corregir. Muchísimos bugs, de hecho
- ¿Uber no estaba intentando también hacer su propia conducción autónoma?
  También es un problema propio de una empresa que recibió una inversión enorme. El valor de Uber se basa menos en lo que hace hoy y más en la expectativa de que volverá obsoleta la idea de tener auto propio o usar transporte público
  Es una exageración, pero aun así es menos exagerado de lo que parece
El tokenmaxxing no tiene sentido. Es como escribir a propósito jobs ineficientes de SQL/Spark para usar la mayor cantidad posible de cómputo, memoria y E/S
Es como meter a propósito un montón de cosas como productos cartesianos y datasets extremadamente sesgados
Cuando una métrica se convierte en objetivo, esto siempre pasa. Las empresas deberían fomentar un entorno donde la IA se use de la manera más eficiente posible, y primero preguntar: “¿de verdad esta tarea necesita un agente?”
Si la respuesta es sí, entonces hay que decidir qué tipo de agente, qué modelo y qué nivel de razonamiento se necesita
También habría que incentivar el ahorro de tokens, aumentar el cache hit rate y estructurar mejor la información para poder usarla con menos contexto. Los grafos de conocimiento funcionan bastante bien para esto
- Es una lógica de nivel preescolar. “Usar X puede dar buenos resultados. Entonces, para maximizar los buenos resultados, hay que usar X lo más posible”
  Es como incendiar una gasolinera para ganar una carrera
- El tokenmaxxing existe porque los ejecutivos creen que los empleados se resisten al cambio
  Es solo una manera de empujar o forzar a todos a experimentar con una tecnología nueva
  Una vez que consideren que todo el mundo ya está usando IA, cosas como el tokenmaxxing naturalmente desaparecerán
- La lógica para defender el tokenmaxxing suele ser que le da a los empleados espacio para explorar libremente el terreno amplio y nuevo de los flujos de trabajo basados en IA
  He visto muchos casos de uso donde es dudoso que se esté generando valor, pero también he visto equipos que resolvieron problemas antiguos con flujos de trabajo tipo agente que habría sido difícil justificar frente a un comité de revisión de costos
  Entiendo que el ahorro de tokens, el aumento del cache hit rate y el trabajo de estructuración de información para usar menos contexto suelen llevarlos por detrás equipos aparte en la mayoría de las grandes empresas de tokenmaxxing
Entiendo que las empresas estén quemando dinero en desarrollo asistido por IA. Pero, ¿qué pasa con el retorno de inversión total? ¿Realmente ha valido lo que dicen en términos de mejora de eficiencia?
Este es el único punto realmente interesante de la fiebre de la IA, y no entiendo por qué nadie lo está discutiendo
- Yo diría que es porque no hay mucha gente que sepa medirlo bien
  Puedes usar Claude para crear 5 funciones inútiles o malas en un día, o 1 función útil en dos días. ¿Cuál de las dos tiene mejor impacto en el retorno de inversión?
  Viéndolo solo como ejemplo parece una pregunta fácil, pero en la realidad es muchísimo más matizado y mucho más difícil de medir
  Por eso parece que muchas empresas simplemente renuncian a medir y eligen el camino fácil de seguir el hype
Estoy convencido de que, usándola bien e incluyendo code review, la mejora máxima sostenible con IA para productividad de ingeniería, en el caso de un ingeniero senior con la experiencia adecuada, es de alrededor de 20%
Ningún presupuesto de tokens para un ingeniero debería pasar de eso
No creo que un ingeniero que hace tokenmaxxing sea realmente productivo, y no he visto absolutamente ninguna evidencia de ello. Si acaso, podría ser más bien lo contrario
Con el flujo correcto y conocimiento del codebase, personalmente sí he sentido que ese nivel es posible con un esfuerzo sostenible
Parece que la IA para productividad en ingeniería se malinterpreta ampliamente como un botón mágico que entrega el mismo resultado más rápido y más barato
Bajo esa lógica, es natural querer obligar a los empleados a hacer tokenmaxxing. Si puedes obtener más resultados, más rápido y más barato, ¿por qué no hacerlo?
Visto con más matices, la realidad es esta: la IA sí ayuda a avanzar un roadmap algo más rápido, pero genera deuda técnica parecida a contratar desarrolladores temporales para construir funciones
Tampoco es seguro que aparezca dentro del equipo alguien que realmente entienda el código nuevo
Del mismo modo, también se reduce el desarrollo de habilidades de los miembros junior del equipo. Es más difícil extraer como antes el arbitraje entre habilidad y salario
El producto también puede volverse más complejo. Si una función es P2, es por algo, pero la IA puede hacer que se incluyan funciones de bajo beneficio marginal y eso complique el producto
Me impacta que alguien haya creído que el tokenmaxxing era una buena idea
Los maximalistas de la IA suelen comparar esta tecnología con la electricidad. Imaginen que, en los inicios de la electrificación, un CEO hubiera recompensado a sus empleados por aumentar el consumo de electricidad en lugar de encontrar formas de usarla para mejorar el negocio
En esa época era común internar en instituciones a personas que mostraban señales de trastornos mentales, así que probablemente algo así habría terminado de esa manera
- El problema es que, a nivel individual, sí es una buena estrategia. La mala gestión interpreta eso como una señal de productividad