2 puntos por GN⁺ 5 시간 전 | 4 comentarios | Compartir por WhatsApp
  • OpenAI, Anthropic y Google, entre otros, están ofreciendo a las empresas precios de suscripción por debajo del costo real de prestación, lo que puede generar un fuerte impacto de costos cuando ajusten los precios
  • La tarifa plana de 20 dólares al mes de Claude Pro y ChatGPT Plus puede escalar, para usuarios intensivos, a un costo real equivalente por API de 200 a 400 dólares mensuales por asiento
  • La IA agéntica incrementa fuertemente el consumo de tokens al operar de forma autónoma durante largos periodos, y GitHub Copilot también pasará a cobro por uso en junio de 2026
  • El costo de suscripción mensual de 1,000 dólares para un equipo de 50 personas puede convertirse en 15,000 a 40,000 dólares al mes medido por consumo real de tokens, aumentando la exposición presupuestaria
  • Los preparativos de OpenAI y Anthropic para una IPO aumentan la presión sobre los márgenes y la economía unitaria, lo que podría acelerar alzas de precios, límites de uso o el cambio a cobro basado en consumo

La brecha entre el precio de suscripción de IA y el costo real

  • Los principales proveedores de IA como OpenAI, Anthropic y Google están ofreciendo servicios a clientes empresariales con precios de suscripción inferiores al costo real de prestación, y si las empresas toman ese precio como referencia permanente y construyen sus flujos de trabajo sobre esa base, podrían recibir un fuerte golpe de costos cuando haya ajustes de precios
  • Claude Pro ofrece por 20 dólares al mes Sonnet 4.6, Opus 4.6, búsqueda web, ejecución de código, generación de archivos y aproximadamente 5 veces más uso que el nivel gratuito
  • En API, Sonnet 4.6 cuesta 3 dólares por cada millón de tokens de entrada y 15 dólares por cada millón de tokens de salida, mientras que Opus 4.6 cuesta 5 dólares por cada millón de tokens de entrada y 25 dólares por cada millón de tokens de salida
  • Si un trabajador del conocimiento usa Claude varias horas al día para subir documentos, redactar reportes y hacer análisis de datos, puede consumir millones de tokens por semana, lo que al convertirlo a tarifas de API puede subir hasta 200 a 400 dólares mensuales por asiento
  • Se reportó que Microsoft perdió más de 20 dólares al mes por usuario con GitHub Copilot, y que el costo de cómputo de usuarios intensivos con una suscripción mensual de 10 dólares llegó hasta 80 dólares
  • También hay análisis que señalan que los usuarios de Anthropic consumieron más de 8 dólares de cómputo por cada 1 dólar de ingresos por suscripción, y Nick Turley, VP de producto de OpenAI, describió la estructura de precios de suscripción como algo que se asentó por accidente y comparó la posible eliminación gradual de los planes ilimitados con el uso ilimitado de electricidad
  • ChatGPT Plus ha mantenido el precio de 20 dólares al mes durante 3 años, pero en ese tiempo agregó funciones como generación de imágenes, interpretación de código, modo de voz, razonamiento agéntico y búsqueda web

Estrategia común de precios entre los principales proveedores

  • Google incluye Gemini Advanced dentro de Google One AI Premium por 20 dólares al mes, mientras cobra aparte el acceso vía API al mismo modelo
  • Meta ofrece Llama gratis y subsidia con ingresos publicitarios el costo de cómputo de cientos de millones de consultas de IA generadas en sus propias plataformas
  • Grok de xAI fijó un precio de entrada de API tan bajo como 0.20 dólares por millón de tokens, y se le describe como una estructura que acepta pérdidas para ganar participación de mercado
  • El patrón común es fijar precios orientados a expandir la adopción más que a la rentabilidad, amarrar a las organizaciones, volver la IA un componente central de la operación diaria de cada equipo y dejar el problema del costo para después
  • OpenAI está perdiendo dinero con los suscriptores de consumo y, según reportes, está evaluando un cambio de estrategia para enfocarse más en el segmento empresarial, donde la economía unitaria es relativamente menos mala
  • Según The Wall Street Journal, OpenAI no alcanzó metas clave de ingresos y usuarios en su camino hacia una IPO, y el esquema de precios subsidiados también empieza a mostrar grietas

La IA agéntica empeora la estructura de costos

  • En el uso de chatbots, preguntas y respuestas generaban un consumo de tokens relativamente predecible, pero la IA agéntica aumenta mucho el uso de tokens al operar de forma autónoma durante largos periodos
  • Las sesiones de Claude Code se ejecutan de forma autónoma durante largos periodos y consumen tokens a una velocidad mucho mayor que el uso interactivo
  • Algunos usuarios reportaron haber agotado una ventana de límite de velocidad de 5 horas en solo 90 minutos
  • GitHub anunció que moverá Copilot a cobro por uso a partir del 1 de junio de 2026 porque el modelo de tarifa plana colapsó bajo cargas de trabajo agénticas
  • GitHub explicó que Copilot ha evolucionado de forma importante y que el uso agéntico "se está volviendo el valor predeterminado", elevando así las necesidades de cómputo y razonamiento
  • Sam Altman ha dicho públicamente que OpenAI ahora debe convertirse en una empresa de razonamiento de IA, lo que conecta con la idea de que el uso agéntico requiere un modelo económico fundamentalmente distinto
  • En equipos de ingeniería, los Agent Teams, donde múltiples instancias de IA trabajan en paralelo sobre un mismo proyecto, disparan el gasto: si un desarrollador ejecuta 3 o 4 agentes de código al mismo tiempo, el uso de tokens puede crecer no solo varias veces frente a una conversación simple, sino más de un orden de magnitud

La exposición de costos que las empresas no están midiendo

  • En los últimos 2 años, muchas empresas han integrado las suscripciones de IA profundamente en la operación: marketing redacta copys con ChatGPT Plus, ingeniería escribe y revisa código con Claude Pro, y los equipos de research, customer success y finanzas también usan IA para resumir documentos, tickets y modelar escenarios
  • Si 50 personas usan Claude Pro, hoy el costo es de 1,000 dólares al mes, y ChatGPT Plus está en un rango similar, por lo que la IA parece una partida pequeña dentro del estado de resultados
  • Pero si se calcula el uso real por API de ese mismo equipo según consumo de tokens, el costo puede subir a 15,000 a 40,000 dólares mensuales según la intensidad de uso, convirtiéndose en una partida que necesita un código presupuestario propio
  • Cuando el precio se ajuste, las empresas que asumieron que una IA de 20 dólares al mes era un insumo permanentemente barato podrían recibir facturas no previstas justo cuando ya es difícil retirarla del flujo de trabajo por su nivel de integración
  • El subsidio crea dependencia, y la dependencia se convierte en una trampa corporativa que hace más difícil evitar subidas de precio
  • Q1 2026 AI Quarterly Pulse de KPMG estima que las organizaciones en Estados Unidos esperan gastar en promedio 207 millones de dólares en IA durante los próximos 12 meses, casi el doble que en el mismo periodo del año anterior
  • Según una encuesta de Goldman Sachs Research, muchas grandes empresas ya están excediendo sus presupuestos de IA por márgenes de múltiples dígitos, y el gasto en IA podría acercarse al costo de las nóminas de ingeniería en el futuro cercano
  • Swami Chandrasekaran, líder del AI & Data Lab de KPMG North America, dijo a Marketplace que hace apenas uno o dos trimestres casi nadie prestaba atención al costo de consumo de LLM
  • El economista Brian Jabarian, de la University of Chicago, quien asesora transformaciones empresariales con IA, dijo que ya se acerca la hora de la factura

La IPO podría forzar un reajuste de precios

Señales de reajuste de precios que ya están apareciendo

Lo que deben hacer ahora los líderes empresariales

  • Las empresas deben auditar el consumo real de tokens por equipo, no solo contar asientos
  • Deben modelar cómo cambiaría el costo de IA bajo escenarios de 2x, 5x y 10x frente al precio actual
  • Deben construir opcionalidad de proveedores dentro de su stack para que un cambio de precio de un solo proveedor no destruya repentinamente el presupuesto
  • Deben discutir la brecha de costos de IA con el CFO antes de que el CFO plantee el problema primero
  • La diferencia entre lo que una organización paga hoy por IA y lo que pagará dentro de 18 meses puede convertirse en uno de los mayores incrementos de gasto que muchas empresas tendrán que absorber
  • Algunas empresas podrían tener que explicar cómo una herramienta que antes costaba menos que el almuerzo del equipo de pronto pasó a requerir un presupuesto anual de seis cifras
  • La era de los subsidios está llegando a su fin, y muchas empresas todavía ni siquiera han empezado esta conversación

4 comentarios

 
hmmhmmhm 2 시간 전

Parece el mismo tema que en la época del mainframe..
Si se da esa dinámica de que los servidores son caros y los recursos escasean, mientras que las computadoras personales son lentas,
al final los servidores también se abaratarán y las computadoras personales también mejorarán su rendimiento... creo que el tiempo dará la respuesta.

 
master6559 3 시간 전

Si es caro, basta con no usarlo..

 
aer0700 2 시간 전

Como asumen que igual lo vamos a pagar aunque sea caro, los proveedores de LLM están subiendo los precios. Me da curiosidad ver qué va a pasar de aquí en adelante con LLM open source como GLM, qwen y deepseek. La gente va a empezar a hacer cuentas sobre si de verdad vale la pena pagar estos precios para usar modelos frontier, o si más bien conviene usar open source incluso haciendo el esfuerzo de implementar su propia infraestructura con vLLM.

 
GN⁺ 5 시간 전
Opiniones de Hacker News
  • Todas las suscripciones de IA son como una bomba de tiempo para los proveedores de modelos frontier
    En unos años será posible ejecutar modelos locales tan buenos como los modelos frontier de hoy con casi ningún costo, y la base del mercado empresarial de las compañías frontier se derrumbará

    • No sé cuál es la base para decir que “en unos años ejecutaremos modelos locales tan buenos como los modelos frontier de hoy”
      Tan solo los requisitos de memoria ya son enormes, y por un buen tiempo seguirá siendo mucho más eficiente en costos usar hardware de hosting especializado y compartido con alta utilización
    • Dicho de otra forma, los modelos frontier son activos que pierden valor muy rápido por la competencia del mercado
      Tienen que seguir mejorando para mantenerse por delante entre sí y de los modelos de pesos abiertos, así que en realidad se parecen más a lo contrario de una bomba de tiempo
      Los tokens de inferencia del nivel actual seguirán abaratándose, y no sé si lo local será el estado final porque los requisitos de hardware son altos, pero la competencia tiende a empujar los márgenes de ganancia hacia 0
      Una discusión larga sobre este tema: https://corecursive.com/the-pre-training-wall-and-the-treadm...
    • En el último mes armé un pequeño demo conectando Qwen, Gemma y Deepseek detrás de LiteLLM para mostrar cómo podría verse el futuro
      Estoy monitoreando el uso de tokens y moviéndome activamente para bajar los costos de inferencia e internalizarlos, en vez de gastar tokens a lo bruto
      Mi jefe quedó muy satisfecho, y ahora lo estamos desplegando más ampliamente. Creo que ese es el futuro
    • La idea de que en unos años ejecutaremos modelos locales tan buenos como los modelos frontier de hoy es muy dudosa
      Las leyes de escalado ya se han vuelto pesadas, y no hay que dejarse llevar por la exageración de lo “exponencial”
      Además, el competidor real son los modelos frontier de dentro de 2 años
    • A menos que haya un avance importante en producción de hardware o en arquitectura de modelos, en realidad es al revés
      Hoy se necesita hardware más grande, más caro y que consume más energía que hace 1 o 2 años
  • El tono exagerado de los textos de ambos bandos sobre IA ya cansa demasiado
    Me gustaría pararme frente a un pizarrón con alguien que realmente entienda bien la economía y el negocio de los proveedores de tokens y preguntarle “como si tuviera cinco años”
    Quiero saber si para el proveedor de tokens esto es un juego de márgenes y para el consumidor es un juego de calidad de servicio/producto, y si, si en algún momento la línea entre calidad y margen se cruza, esto es una carrera por llegar a ese punto antes de que se acabe el dinero; y, de ser así, si hay casos históricos donde la diferencia entre ambas cosas haya sido muy grande
    Los LLM parecen únicos en que prácticamente no tienen un límite claro de “qué tanto mejor esperan que se pongan” los consumidores, y no son como servicios fáciles de escalar en términos de recursos computacionales, como el correo electrónico
    Es una pregunta muy básica, pero también me pregunto por qué querrían hacer un IPO antes de tener un modelo de negocio sostenible. ¿Cuál es la ventaja?

    • Le pregunté a una IA el costo de producir tokens de Opus y me respondió que era de 0.216 dólares por millón de tokens, incluyendo hardware, electricidad, enfriamiento y hosting
      Según los enlaces compartidos aquí, cerca del 30% del gasto de Anthropic es inferencia, y el otro 70% es I+D, como el desarrollo del siguiente modelo
      Si reflejas eso y le agregas una ganancia, simplificando los números, bastaría vender a alrededor de 1 dólar por millón de tokens para ganar dinero
      El precio actual del API es de 25 dólares por millón de tokens, así que no tengo dudas de que hay rentabilidad
      En cambio, si se exprime al máximo el plan Max de 200 dólares al mes, podría llegar a 10 mil millones de tokens mensuales, lo que sería 0.02 dólares por millón de tokens, o sea una pérdida enorme que en algún momento desaparecerá
      Pero si alguien usa, digamos, 100 millones de tokens al mes en un plan de Anthropic de 100 dólares al mes, la empresa sí gana dinero
      Para usar 10 mil millones de tokens al mes tendrías que trabajar muchísimo y ser realmente muy hábil usando IA, y alguien así probablemente ya lleva años usándola y le sacaba provecho incluso antes de Opus
      Perder Opus le decepcionaría, pero ese tipo de usuario justamente también sabría aprovechar bien modelos menos potentes, así que en unos años podría cambiarse a un modelo open source alojado internamente y aun así obtener un nivel parecido al actual de 0.02 dólares por millón de tokens
      Por eso no me convence el tono pesimista del texto. La situación cambiará, pero eso no significa el fin del uso de IA
  • Estoy de acuerdo con el sentimiento del texto, pero el estilo se siente demasiado hecho por LLM
    Sobre todo la estructura de las secciones y punchlines como “That is not a rounding error. That is a line item that needs its own budget code.”

    • Claude de verdad genera muchísimo ese tipo de frases
      Es bastante irritante, y con el mismo prompt no lo he visto tanto en Gemini
    • Para empezar, no sé quién escribió este texto
      No trae nombre de autor
    • Pangram marcó este texto con alta confianza como 100% generado por IA
  • Brad Gerstner confirmó que los tokens no se están vendiendo con pérdida
    Sin importar cómo separen la fórmula entre API y suscripciones, las empresas sí están generando utilidad sobre la venta pura de tokens
    Puede que estén en pérdidas si cuentas salarios y compensación en acciones, pero los tokens en sí hoy sí son rentables

    • Es como ver un cohete con los motores más potentes del planeta apagar los motores una vez que sale de la órbita y decir “está volando sin potencia”
      Puede que en este momento sea cierto, pero no fue así como llegó hasta aquí
      La inversión por recuperar es de billones de dólares y los ingresos, con suerte, son de apenas decenas de miles de millones, así que no cuadra la idea de que los tokens vayan a dar ganancias en el corto plazo
    • Los tokens pueden venderse con margen, pero el 70% del gasto en cómputo se va en I+D y entrenamiento de modelos[0]
      La inferencia no solo tiene que ser rentable por sí sola, también tiene que cubrir ese costo
      [0] https://epoch.ai/data-insights/openai-compute-spend
    • No los están vendiendo con pérdida, pero tampoco los están vendiendo lo suficientemente caros como para cubrir las pérdidas y costos actuales
      Las pérdidas se están pateando hacia adelante dentro de una estructura extraña de financiamiento circular, y en algún momento eso probablemente colapse en una crisis de deuda
    • En otras palabras, las empresas de IA tienen utilidad positiva antes de descontar costos
    • No sé si eso también aplique a los tokens de Claude Code o Codex
      Creo que ahí sí hay un subsidio fuerte, aunque son de las pocas cosas donde realmente percibo valor
  • El problema de toda la “IA” es que es muy fácil vivir sin ella
    Las empresas de IA lo saben, los usuarios lo saben, y hasta el gerente más favorable a los agentes de IA lo sabe
    Si imaginamos quitar toda la IA del mundo ahora mismo, el resultado sería simplemente seguir trabajando como siempre
    El texto no enfatiza eso lo suficiente. ¿Se supone que debemos temer el día en que haya que volver a poner a ingenieros reales a revisar los PR?

    • Creo que eso siempre pasa al inicio de la adopción de una nueva tecnología
      Conforme la tecnología se integra más profundamente, eso deja de ser cierto
      También se habría podido decir lo mismo pocos años después de la llegada del motor eléctrico: simplemente habríamos vuelto al vapor
      Pero hoy, si intentaras vivir sin motores eléctricos, la sociedad colapsaría
      La pregunta no es si hoy podemos vivir sin esto, sino si también podremos hacerlo dentro de 5 a 10 años, cuando esté completamente integrado
    • Justamente por eso quizá lo están empujando con más fuerza
      No para generar ingresos honestos, sino para incrustar los productos de IA tan profundamente que “simplemente quitarlos” deje de verse como una opción
      Incluso si el costo de mantenimiento sigue subiendo hasta ir más allá de niveles tipo rescate gubernamental de aerolíneas
      Es una nueva capa intermediaria de extracción de riqueza vendida con promesas falsas
    • Si usas JavaScript, claro que sí
      Al menos para escribir JavaScript, no podría vivir sin IA
    • Siempre se siente raro ver que recomiendan usar herramientas de IA incluso para tareas totalmente normales y genéricas
      Como si fuera una mascota que se muere si no la atiendes de vez en cuando
  • Este texto está equivocado. No es que estas suscripciones no se ofrezcan a empresas
    Las compañías están pagando montos mucho más cercanos al precio del API
    La estrategia es acostumbrar a la gente a tokens ilimitados en la suscripción personal, esperando que ese comportamiento luego se traslade al trabajo

    • Sí se ofrecen
      Los asientos de equipo o enterprise cuestan más que el precio para consumidor, pero siguen siendo de precio fijo con límites de uso que se reinician
      Puedes asignar a miembros asientos equivalentes a los planes de 20/100/200 dólares al mes, o también hacerlo todo por consumo
      Hay varias formas de comprarlo
    • Las suscripciones sí se ofrecen claramente a empresas
      También hay planes por consumo equivalentes a los planes de consumidor correspondientes
    • Me confundió por qué estaban hablando de suscripciones para empresas
      En la empresa donde trabajo nos cobran según uso del API
    • Al ver párrafos así, se parece más a un texto que escupió una IA
      “En términos generales, el patrón es el mismo. Precio para adopción, no para economía. Amarra a las organizaciones. Convierte la IA en una parte estructural del trabajo diario de cada equipo. Ya luego se verá la factura.”
    • Además de eso, la magnitud de los cobros de API por la que el texto se escandaliza sigue siendo relativamente menor
      10 mil dólares al mes no es nada despreciable, pero si con eso apoyas a un equipo de 10 a 20 ingenieros, es un apalancamiento bastante bueno
  • No leí el original completo, pero sí pude notar que lo escribió una IA
    OpenRouter quizá podría servir como punto de referencia del costo base del proveedor de IA
    Sigo escuchando que ofrece mejor relación costo-beneficio que Claude, y si es así, parecería implicar que Anthropic es particularmente ineficiente o que está obteniendo ganancia en inferencia
    Puede que pierdan dinero en entrenamiento, pero eso posiblemente sea el costo de seguir siendo un laboratorio líder
    Si una empresa colapsa por deuda u otras razones, ¿no podrían las empresas simplemente cambiarse a otra?

  • Si vuelvo a ver una sola vez más frases como “It’s not X. It’s Y.” o el uso metafórico de “load-bearing”, voy a vomitar

    • He sacado bastantes de esas expresiones, y no es una lista corta
      “La era del subsidio no está terminando con elegancia. Está mostrando grietas por todas partes.”
      “La pregunta no es si fue un buen trato. Es cuánto tiempo podrá sostenerse.”
      “Un desarrollador que corre tres o cuatro agentes de código al mismo tiempo no usa 3x o 4x los tokens de una conversación de chat. Usa un orden de magnitud más, no una sola cifra más.”
      “Estas ya no son experimentos. Son flujos de trabajo estructurales.”
      “Eso no es un error de redondeo. Es una partida que necesita su propio código presupuestario.”
    • Si llega un gran ajuste de precios, mucha gente que generaba comentarios en redes sociales con suscripciones gratis o de 20 dólares al mes quizá vuelva a escribirlos por su cuenta al ver el costo real
      Al menos podemos tener esa esperanza
    • También me cae mal eso de decir “the unlock”
    • Este texto empezó bien
      Tenía datos y la lógica parecía razonable, pero llegando a la mitad empiezan a aparecer ejemplo de tendencia, otro ejemplo, un tercer ejemplo, y el “eso no es simplemente X sino Y”
      Es tan irritante como estar leyendo un buen texto, hacer clic en el enlace de la fuente y terminar en un rickroll
  • Los clientes enterprise no están usando una suscripción Claude Pro de 20 dólares al mes
    En nuestra empresa damos a cada desarrollador un límite de uso equivalente a unos 1,000 dólares al mes, y por lo que veo el ahorro frente al costo del API es de como mucho 30%
    No es un nivel de subsidio descabellado
    En otros puestos muchas veces solo se permiten 50 dólares al mes, y esa gente sigue topando el límite
    GitHub Copilot ha venido funcionando así en sus asientos business y enterprise, pero pronto va a topar con un límite
    Creo que después de junio, cuando reorganicen las cuentas Pro y Pro+ de consumidor, se pondrán al día rápido
    OpenAI parece estar regalando tokens para amarrar a los clientes, así que lo que más me preocupa es un cambio brusco en precios y condiciones por parte de OpenAI después del IPO
    Anthropic ya se está moviendo de forma responsable en este tema, y GitHub Copilot también está tratando de corregir sus subsidios excesivos en los próximos meses

    • Solo GitHub Copilot estaba dando un subsidio realmente absurdo
      Porque cobraba por “solicitud” y no por token
      Una sola solicitud de 3 centavos podía quemar más de 20 dólares en tokens, y ese esquema termina este mes
      Yo también estaba preocupado porque he venido procesando bloques grandes de trabajo con GHCP, pero al ver el nuevo estimador de facturación, resultó que a precio de API eran unos 150 a 200 dólares al mes
      Sigue siendo un subsidio sobre una suscripción de 20 dólares al mes, pero no es una locura total
      Si usas mucho y de forma responsable herramientas de coding agent, probablemente te quedes alrededor de 200 dólares al mes a precio de API
      Si a ese precio el proveedor todavía gana dinero, para una empresa en Occidente que contrata desarrolladores no es difícil de aceptar considerando el tiempo que se ahorra
      El verdadero riesgo está en los vibe coders con proyectos personales
      La era de construir apps enormes abusando de planes subsidiados está llegando a su fin
  • Si realmente reemplaza a un desarrollador, tiene sentido que cueste más de 20 o 100 dólares al mes
    El verdadero problema de las empresas de LLM es que todavía no han demostrado valor fuera de la programación
    Si no logran eso, van a degradarse a simples herramientas de coding
    Por eso tienen tanta prisa ahora, y la clave es qué flujos de trabajo pueden automatizar más
    Tal vez puedan automatizar por completo todo el trabajo de papeleo
    Si otras áreas se desarrollan, cambiarán el modelo de precios

    • También están intentando en cierta medida reemplazar Figma
      Eso sí podría tener valor