- Microsoft está reduciendo el costo de sus herramientas internas de IA al cancelar la mayoría de las licencias directas de Claude Code y trasladar a los ingenieros a GitHub Copilot CLI
- Claude Code fue ofrecido a miles de empleados para experimentos de programación y rápidamente se volvió popular, pero a medida que creció su uso también aumentó la carga de costos
- Uber ya agotó en solo cuatro meses todo su presupuesto de herramientas de programación con IA para 2026, y promueve el uso de herramientas de IA por equipo con una tabla de posiciones interna
- A medida que las empresas aumentan el uso de tokens para mejorar la productividad, aunque baje el precio por token la factura total puede crecer
- Goldman Sachs cree que la IA agéntica podría multiplicar por 24 el consumo de tokens para 2030, y Gartner también considera que el aumento del consumo puede superar la caída de precios
Expansión del uso interno de IA en empresas y presión de costos
- Microsoft empezó a cancelar la mayoría de las licencias directas de Claude Code tras un reporte de The Verge, y está trasladando a los ingenieros a GitHub Copilot CLI
- El acceso a Claude Code se había ofrecido hace seis meses a miles de empleados, incluidos desarrolladores, gerentes de proyecto y diseñadores, para experimentos de programación, y ganó popularidad rápidamente, pero al crecer la escala de uso se hizo más visible el problema del costo
- La cancelación de licencias de Claude Code no afecta el acuerdo Foundry de Microsoft
- Este acuerdo incluye una inversión de hasta 5 mil millones de dólares en Anthropic, acceso de los clientes de Foundry a los modelos Claude y el compromiso de compra de 30 mil millones de dólares en capacidad de cómputo de Azure por parte de Anthropic
- El CTO de Uber, Praveen Neppalli Naga, dijo a The Information que Uber ya consumió en cuatro meses todo su presupuesto de herramientas de programación con IA para 2026
- Uber impulsa activamente la adopción con una tabla de posiciones interna que clasifica el uso de herramientas de IA por equipo
- Bryan Catanzaro, vicepresidente de deep learning aplicado de Nvidia, dijo en una entrevista con Axios: “En mi equipo, el costo de cómputo supera por mucho el costo de los empleados”
- Anthropic no respondió de inmediato a la solicitud de comentarios de Fortune, y Microsoft tampoco emitió comentarios
Cómo tokens más baratos pueden producir facturas más grandes
- Las empresas están empujando la expansión del uso de IA entre los empleados para mejorar la productividad, pero en un esquema de cobro basado en tokens, cuanto más aumenta el uso, más crece el costo total
- Un empleado de Meta creó una tabla de posiciones llamada “Claudeonomics”, en referencia al nombre del modelo de Anthropic, para rastrear el uso de IA por empleado
- Amazon está alentando a sus empleados a practicar “tokenmaxxing”, es decir, usar la mayor cantidad posible de tokens, la unidad básica de cómputo en IA
- Goldman Sachs proyecta que, con la adopción de agentes de IA por consumidores y empresas, la IA agéntica podría multiplicar por 24 el consumo de tokens para 2030, hasta llegar a 120 sextillones de tokens al mes
- Gartner estima que para 2030 el costo de inferencia de un LLM de 1 billón de parámetros será casi 90% menor que en 2025, pero prevé que tokens más baratos no se traducirán automáticamente en menores costos de IA para las empresas
- Los modelos agénticos requieren muchos más tokens por tarea que los modelos estándar
- El aumento del consumo puede superar la caída del precio unitario
- Los proveedores de IA podrían no trasladar completamente a los consumidores la reducción de costos
- Will Sommer, analista director senior de Gartner, advirtió: “Los CPO no deben confundir la deflación de los tokens de propósito general con la democratización del razonamiento de frontera”
- El CEO de Nvidia, Jensen Huang, dijo que algún día 100 agentes de IA trabajarán junto a cada empleado, pero si el consumo de tokens crece más rápido que la caída de precios, este futuro agéntico podría implicar costos mucho más pesados de lo que esperan los ejecutivos
1 comentarios
Opiniones de Hacker News
La discusión activa basada en la fuente original está aquí: https://news.ycombinator.com/item?id=48238896
El artículo dice que “The Verge informó que Microsoft empezó a cancelar la mayor parte de sus licencias directas de Claude Code”
La parte de “con la facturación basada en tokens, mientras más usas y más eficiente te vuelves, más caro se vuelve” también es rara. No entiendo por qué si mejora la eficiencia aumentaría el costo
El título parece engañoso, y al leer el artículo queda más claro por qué. Estas empresas tienen OKR y metas absurdas de quemar tantos tokens como sea posible
Si conviertes el uso de tokens en una métrica, obviamente terminas con un resultado carísimo
El costo de inferencia en sí es manejable, y para usar esta tecnología de forma útil tampoco hace falta necesariamente el modelo propietario más reciente. Los ingenieros humanos seguirán siendo necesarios por bastante tiempo más, pero no estoy de acuerdo con que “algunos humanos + LLM” vaya a ser más caro que simplemente contratar más humanos, o que vaya a seguir siéndolo
Ahora mismo parece que el problema no es tanto el vibe coding sino el vibe leadership, y el vibe leadership en esencia no tiene nada que ver con la IA. Son personas que se aferran a una intuición vaga y la empujan hasta conclusiones ilógicas sin importar el costo ni los resultados
La premisa de este artículo es incorrecta. Que Microsoft cancele el uso interno de Claude Code no significa que el costo de la IA sea demasiado alto, sino que tiene un producto competidor, GitHub Copilot, y quiere que sus empleados usen su propio producto
Teams recibió tanta atención durante el encierro por la misma razón
Pero ese equipo no usa LLM para desarrollo de software; es literalmente un equipo de deep learning, y quema cómputo al estilo de desarrollo de deep learning
Con solo hacer un cálculo rápido, se ve que Microsoft no puede estar pagando más dinero por IA que por sus desarrolladores. Tiene alrededor de 80 mil empleados en áreas de desarrollo de producto, y el costo total de un desarrollador senior probablemente ronde los 400 mil dólares
¿Tiene Microsoft una factura de Claude por 32 mil millones de dólares? No lo creo
Aun así, no me queda muy claro cómo el caso de Teams durante el encierro es paralelo al argumento anterior
En ninguna parte del artículo dice que Microsoft haya informado que la IA es más cara que los empleados humanos
Aunque Microsoft no lo haya dicho explícitamente, sí queda expuesto el hecho de que la IA es más cara
La moda del tokenmaxxing me parece una de las ideas más tontas que salieron de esta ola de IA. Va exactamente en dirección contraria a maximizar la eficiencia y la productividad, y aun así se ha aceptado ampliamente
http://archive.today/l3EEo
Microsoft canceló Claude porque Copilot no es muy bueno, así que tienen que usar Copilot ellos mismos. Eso se reconoce internamente y no es ningún secreto
Ahora mismo, como los tokens de Anthropic estaban subsidiados, es posible que para Microsoft incluso se haya vuelto más caro
Para analizar el costo de usar IA, hay que ver el contexto de uso
Mucha gente usa IA para pulir documentos, conversaciones de Slack y correos, o para generar documentos innecesariamente grandes a partir de prompts cortos. Nunca hubo una razón para necesitar IA para mandar mensajes de Slack o correos dentro de la empresa. Es desperdiciar recursos y tiempo para que algo se vea más convincente sin cambiar mucho su significado
Quemar tokens es tan fácil como tirar dinero al horno
El uso de tokens no es una buena métrica de productividad. El problema es que nadie ha descubierto todavía cómo medir bien un uso productivo de la IA. Es difícil distinguir si los desarrolladores están maximizando la productividad, solo quemando tokens o resistiéndose al cambio
La IA no es más cara que pagarle un salario a un empleado humano. La premisa del título es incorrecta, porque la IA todavía no puede reemplazar a un empleado humano