1 puntos por GN⁺ 4 시간 전 | 1 comentarios | Compartir por WhatsApp
  • Microsoft está reduciendo el costo de sus herramientas internas de IA al cancelar la mayoría de las licencias directas de Claude Code y trasladar a los ingenieros a GitHub Copilot CLI
  • Claude Code fue ofrecido a miles de empleados para experimentos de programación y rápidamente se volvió popular, pero a medida que creció su uso también aumentó la carga de costos
  • Uber ya agotó en solo cuatro meses todo su presupuesto de herramientas de programación con IA para 2026, y promueve el uso de herramientas de IA por equipo con una tabla de posiciones interna
  • A medida que las empresas aumentan el uso de tokens para mejorar la productividad, aunque baje el precio por token la factura total puede crecer
  • Goldman Sachs cree que la IA agéntica podría multiplicar por 24 el consumo de tokens para 2030, y Gartner también considera que el aumento del consumo puede superar la caída de precios

Expansión del uso interno de IA en empresas y presión de costos

  • Microsoft empezó a cancelar la mayoría de las licencias directas de Claude Code tras un reporte de The Verge, y está trasladando a los ingenieros a GitHub Copilot CLI
  • El acceso a Claude Code se había ofrecido hace seis meses a miles de empleados, incluidos desarrolladores, gerentes de proyecto y diseñadores, para experimentos de programación, y ganó popularidad rápidamente, pero al crecer la escala de uso se hizo más visible el problema del costo
  • La cancelación de licencias de Claude Code no afecta el acuerdo Foundry de Microsoft
    • Este acuerdo incluye una inversión de hasta 5 mil millones de dólares en Anthropic, acceso de los clientes de Foundry a los modelos Claude y el compromiso de compra de 30 mil millones de dólares en capacidad de cómputo de Azure por parte de Anthropic
  • El CTO de Uber, Praveen Neppalli Naga, dijo a The Information que Uber ya consumió en cuatro meses todo su presupuesto de herramientas de programación con IA para 2026
  • Uber impulsa activamente la adopción con una tabla de posiciones interna que clasifica el uso de herramientas de IA por equipo
  • Bryan Catanzaro, vicepresidente de deep learning aplicado de Nvidia, dijo en una entrevista con Axios: “En mi equipo, el costo de cómputo supera por mucho el costo de los empleados”
  • Anthropic no respondió de inmediato a la solicitud de comentarios de Fortune, y Microsoft tampoco emitió comentarios

Cómo tokens más baratos pueden producir facturas más grandes

  • Las empresas están empujando la expansión del uso de IA entre los empleados para mejorar la productividad, pero en un esquema de cobro basado en tokens, cuanto más aumenta el uso, más crece el costo total
  • Un empleado de Meta creó una tabla de posiciones llamada “Claudeonomics”, en referencia al nombre del modelo de Anthropic, para rastrear el uso de IA por empleado
  • Amazon está alentando a sus empleados a practicar “tokenmaxxing”, es decir, usar la mayor cantidad posible de tokens, la unidad básica de cómputo en IA
  • Goldman Sachs proyecta que, con la adopción de agentes de IA por consumidores y empresas, la IA agéntica podría multiplicar por 24 el consumo de tokens para 2030, hasta llegar a 120 sextillones de tokens al mes
  • Gartner estima que para 2030 el costo de inferencia de un LLM de 1 billón de parámetros será casi 90% menor que en 2025, pero prevé que tokens más baratos no se traducirán automáticamente en menores costos de IA para las empresas
    • Los modelos agénticos requieren muchos más tokens por tarea que los modelos estándar
    • El aumento del consumo puede superar la caída del precio unitario
    • Los proveedores de IA podrían no trasladar completamente a los consumidores la reducción de costos
  • Will Sommer, analista director senior de Gartner, advirtió: “Los CPO no deben confundir la deflación de los tokens de propósito general con la democratización del razonamiento de frontera”
  • El CEO de Nvidia, Jensen Huang, dijo que algún día 100 agentes de IA trabajarán junto a cada empleado, pero si el consumo de tokens crece más rápido que la caída de precios, este futuro agéntico podría implicar costos mucho más pesados de lo que esperan los ejecutivos

1 comentarios

 
GN⁺ 4 시간 전
Opiniones de Hacker News
  • La discusión activa basada en la fuente original está aquí: https://news.ycombinator.com/item?id=48238896
    El artículo dice que “The Verge informó que Microsoft empezó a cancelar la mayor parte de sus licencias directas de Claude Code”

    • Este artículo parece estar bastante mal escrito
      1. No hay ninguna cita donde Microsoft diga que la IA es más cara que los empleados
      2. Que el equipo de deep learning de Nvidia gaste más en IA que en empleados tiene sentido, pero ese equipo no se dedica a coding con agentes, sino a un uso de IA profundo y pesado
        La parte de “con la facturación basada en tokens, mientras más usas y más eficiente te vuelves, más caro se vuelve” también es rara. No entiendo por qué si mejora la eficiencia aumentaría el costo
  • El título parece engañoso, y al leer el artículo queda más claro por qué. Estas empresas tienen OKR y metas absurdas de quemar tantos tokens como sea posible
    Si conviertes el uso de tokens en una métrica, obviamente terminas con un resultado carísimo
    El costo de inferencia en sí es manejable, y para usar esta tecnología de forma útil tampoco hace falta necesariamente el modelo propietario más reciente. Los ingenieros humanos seguirán siendo necesarios por bastante tiempo más, pero no estoy de acuerdo con que “algunos humanos + LLM” vaya a ser más caro que simplemente contratar más humanos, o que vaya a seguir siéndolo

    • Fácilmente podrían haberlo dicho así: la empresa implementó un OKR para que el departamento de TI gastara más de 1000 dólares al día por cada desarrollador. La empresa se sorprende de que los costos de TI sean mucho mayores que antes. Y luego lo sube a 1500 dólares al día por desarrollador, diciendo que va a crear un sistema para averiguar por qué está pasando esto
      Ahora mismo parece que el problema no es tanto el vibe coding sino el vibe leadership, y el vibe leadership en esencia no tiene nada que ver con la IA. Son personas que se aferran a una intuición vaga y la empujan hasta conclusiones ilógicas sin importar el costo ni los resultados
    • Viendo solo el artículo, parece que no abandonaron la “IA”, sino que cambiaron el LLM de Claude Code a GitHub Copilot
    • Ley de Goodhart: cuando una métrica se convierte en objetivo, deja de ser una buena métrica
    • Me da la impresión de que las cifras de ingresos que entusiasman a los inversionistas se basan precisamente en ese mundo donde los tokens son la métrica. No puede ser ambas cosas a la vez: un negocio con crecimiento explosivo y, al mismo tiempo, uno donde solo hay retorno de inversión si se aprieta más el gasto
    • Parece que los medios están decididos a prenderle fuego a la IA. El feed de noticias está lleno solo de artículos sobre la maldad de los centros de datos, la inutilidad de la IA y que todo el mundo odia la IA
  • La premisa de este artículo es incorrecta. Que Microsoft cancele el uso interno de Claude Code no significa que el costo de la IA sea demasiado alto, sino que tiene un producto competidor, GitHub Copilot, y quiere que sus empleados usen su propio producto
    Teams recibió tanta atención durante el encierro por la misma razón

    • Sí. El artículo mezcla la acción de Microsoft con un problema de costos, cuando en realidad no se trata de costos. Además le agrega una cita arbitraria del “vicepresidente de deep learning aplicado de Nvidia”, diciendo que en su equipo los costos de cómputo son mayores que los costos laborales
      Pero ese equipo no usa LLM para desarrollo de software; es literalmente un equipo de deep learning, y quema cómputo al estilo de desarrollo de deep learning
      Con solo hacer un cálculo rápido, se ve que Microsoft no puede estar pagando más dinero por IA que por sus desarrolladores. Tiene alrededor de 80 mil empleados en áreas de desarrollo de producto, y el costo total de un desarrollador senior probablemente ronde los 400 mil dólares
      ¿Tiene Microsoft una factura de Claude por 32 mil millones de dólares? No lo creo
    • Ambas cosas podrían ser ciertas. Claude podría ser demasiado caro y, al mismo tiempo, podrían querer mover a los empleados a Copilot. Al ser su propio producto, eso reduce costos y podrían esperar más uso y más retroalimentación como resultado
      Aun así, no me queda muy claro cómo el caso de Teams durante el encierro es paralelo al argumento anterior
  • En ninguna parte del artículo dice que Microsoft haya informado que la IA es más cara que los empleados humanos

    • Vaya… ¿qué le pasó a Fortune? Pensaba que era un medio mucho mejor que este tipo de clickbait
    • Tal vez al título de la publicación le faltó una palabra. Debería ser “Microsoft reports show AI is more expensive…”
      Aunque Microsoft no lo haya dicho explícitamente, sí queda expuesto el hecho de que la IA es más cara
  • La moda del tokenmaxxing me parece una de las ideas más tontas que salieron de esta ola de IA. Va exactamente en dirección contraria a maximizar la eficiencia y la productividad, y aun así se ha aceptado ampliamente

  • http://archive.today/l3EEo

  • Microsoft canceló Claude porque Copilot no es muy bueno, así que tienen que usar Copilot ellos mismos. Eso se reconoce internamente y no es ningún secreto
    Ahora mismo, como los tokens de Anthropic estaban subsidiados, es posible que para Microsoft incluso se haya vuelto más caro

  • Para analizar el costo de usar IA, hay que ver el contexto de uso
    Mucha gente usa IA para pulir documentos, conversaciones de Slack y correos, o para generar documentos innecesariamente grandes a partir de prompts cortos. Nunca hubo una razón para necesitar IA para mandar mensajes de Slack o correos dentro de la empresa. Es desperdiciar recursos y tiempo para que algo se vea más convincente sin cambiar mucho su significado

    • Para ese tipo de usos, el costo sí suele ser bastante bajo
  • Quemar tokens es tan fácil como tirar dinero al horno
    El uso de tokens no es una buena métrica de productividad. El problema es que nadie ha descubierto todavía cómo medir bien un uso productivo de la IA. Es difícil distinguir si los desarrolladores están maximizando la productividad, solo quemando tokens o resistiéndose al cambio

    • Es la nueva métrica de líneas de código
  • La IA no es más cara que pagarle un salario a un empleado humano. La premisa del título es incorrecta, porque la IA todavía no puede reemplazar a un empleado humano