Las suscripciones de IA son una bomba de tiempo para las empresas
(thestateofbrand.com)- OpenAI, Anthropic y Google, entre otros, están ofreciendo a las empresas precios de suscripción por debajo del costo real de prestación, lo que puede generar un fuerte impacto de costos cuando ajusten los precios
- La tarifa plana de 20 dólares al mes de Claude Pro y ChatGPT Plus puede escalar, para usuarios intensivos, a un costo real equivalente por API de 200 a 400 dólares mensuales por asiento
- La IA agéntica incrementa fuertemente el consumo de tokens al operar de forma autónoma durante largos periodos, y GitHub Copilot también pasará a cobro por uso en junio de 2026
- El costo de suscripción mensual de 1,000 dólares para un equipo de 50 personas puede convertirse en 15,000 a 40,000 dólares al mes medido por consumo real de tokens, aumentando la exposición presupuestaria
- Los preparativos de OpenAI y Anthropic para una IPO aumentan la presión sobre los márgenes y la economía unitaria, lo que podría acelerar alzas de precios, límites de uso o el cambio a cobro basado en consumo
La brecha entre el precio de suscripción de IA y el costo real
- Los principales proveedores de IA como OpenAI, Anthropic y Google están ofreciendo servicios a clientes empresariales con precios de suscripción inferiores al costo real de prestación, y si las empresas toman ese precio como referencia permanente y construyen sus flujos de trabajo sobre esa base, podrían recibir un fuerte golpe de costos cuando haya ajustes de precios
- Claude Pro ofrece por 20 dólares al mes Sonnet 4.6, Opus 4.6, búsqueda web, ejecución de código, generación de archivos y aproximadamente 5 veces más uso que el nivel gratuito
- En API, Sonnet 4.6 cuesta 3 dólares por cada millón de tokens de entrada y 15 dólares por cada millón de tokens de salida, mientras que Opus 4.6 cuesta 5 dólares por cada millón de tokens de entrada y 25 dólares por cada millón de tokens de salida
- Si un trabajador del conocimiento usa Claude varias horas al día para subir documentos, redactar reportes y hacer análisis de datos, puede consumir millones de tokens por semana, lo que al convertirlo a tarifas de API puede subir hasta 200 a 400 dólares mensuales por asiento
- Se reportó que Microsoft perdió más de 20 dólares al mes por usuario con GitHub Copilot, y que el costo de cómputo de usuarios intensivos con una suscripción mensual de 10 dólares llegó hasta 80 dólares
- También hay análisis que señalan que los usuarios de Anthropic consumieron más de 8 dólares de cómputo por cada 1 dólar de ingresos por suscripción, y Nick Turley, VP de producto de OpenAI, describió la estructura de precios de suscripción como algo que se asentó por accidente y comparó la posible eliminación gradual de los planes ilimitados con el uso ilimitado de electricidad
- ChatGPT Plus ha mantenido el precio de 20 dólares al mes durante 3 años, pero en ese tiempo agregó funciones como generación de imágenes, interpretación de código, modo de voz, razonamiento agéntico y búsqueda web
Estrategia común de precios entre los principales proveedores
- Google incluye Gemini Advanced dentro de Google One AI Premium por 20 dólares al mes, mientras cobra aparte el acceso vía API al mismo modelo
- Meta ofrece Llama gratis y subsidia con ingresos publicitarios el costo de cómputo de cientos de millones de consultas de IA generadas en sus propias plataformas
- Grok de xAI fijó un precio de entrada de API tan bajo como 0.20 dólares por millón de tokens, y se le describe como una estructura que acepta pérdidas para ganar participación de mercado
- El patrón común es fijar precios orientados a expandir la adopción más que a la rentabilidad, amarrar a las organizaciones, volver la IA un componente central de la operación diaria de cada equipo y dejar el problema del costo para después
- OpenAI está perdiendo dinero con los suscriptores de consumo y, según reportes, está evaluando un cambio de estrategia para enfocarse más en el segmento empresarial, donde la economía unitaria es relativamente menos mala
- Según The Wall Street Journal, OpenAI no alcanzó metas clave de ingresos y usuarios en su camino hacia una IPO, y el esquema de precios subsidiados también empieza a mostrar grietas
La IA agéntica empeora la estructura de costos
- En el uso de chatbots, preguntas y respuestas generaban un consumo de tokens relativamente predecible, pero la IA agéntica aumenta mucho el uso de tokens al operar de forma autónoma durante largos periodos
- Las sesiones de Claude Code se ejecutan de forma autónoma durante largos periodos y consumen tokens a una velocidad mucho mayor que el uso interactivo
- Algunos usuarios reportaron haber agotado una ventana de límite de velocidad de 5 horas en solo 90 minutos
- GitHub anunció que moverá Copilot a cobro por uso a partir del 1 de junio de 2026 porque el modelo de tarifa plana colapsó bajo cargas de trabajo agénticas
- GitHub explicó que Copilot ha evolucionado de forma importante y que el uso agéntico "se está volviendo el valor predeterminado", elevando así las necesidades de cómputo y razonamiento
- Sam Altman ha dicho públicamente que OpenAI ahora debe convertirse en una empresa de razonamiento de IA, lo que conecta con la idea de que el uso agéntico requiere un modelo económico fundamentalmente distinto
- En equipos de ingeniería, los Agent Teams, donde múltiples instancias de IA trabajan en paralelo sobre un mismo proyecto, disparan el gasto: si un desarrollador ejecuta 3 o 4 agentes de código al mismo tiempo, el uso de tokens puede crecer no solo varias veces frente a una conversación simple, sino más de un orden de magnitud
La exposición de costos que las empresas no están midiendo
- En los últimos 2 años, muchas empresas han integrado las suscripciones de IA profundamente en la operación: marketing redacta copys con ChatGPT Plus, ingeniería escribe y revisa código con Claude Pro, y los equipos de research, customer success y finanzas también usan IA para resumir documentos, tickets y modelar escenarios
- Si 50 personas usan Claude Pro, hoy el costo es de 1,000 dólares al mes, y ChatGPT Plus está en un rango similar, por lo que la IA parece una partida pequeña dentro del estado de resultados
- Pero si se calcula el uso real por API de ese mismo equipo según consumo de tokens, el costo puede subir a 15,000 a 40,000 dólares mensuales según la intensidad de uso, convirtiéndose en una partida que necesita un código presupuestario propio
- Cuando el precio se ajuste, las empresas que asumieron que una IA de 20 dólares al mes era un insumo permanentemente barato podrían recibir facturas no previstas justo cuando ya es difícil retirarla del flujo de trabajo por su nivel de integración
- El subsidio crea dependencia, y la dependencia se convierte en una trampa corporativa que hace más difícil evitar subidas de precio
- Q1 2026 AI Quarterly Pulse de KPMG estima que las organizaciones en Estados Unidos esperan gastar en promedio 207 millones de dólares en IA durante los próximos 12 meses, casi el doble que en el mismo periodo del año anterior
- Según una encuesta de Goldman Sachs Research, muchas grandes empresas ya están excediendo sus presupuestos de IA por márgenes de múltiples dígitos, y el gasto en IA podría acercarse al costo de las nóminas de ingeniería en el futuro cercano
- Swami Chandrasekaran, líder del AI & Data Lab de KPMG North America, dijo a Marketplace que hace apenas uno o dos trimestres casi nadie prestaba atención al costo de consumo de LLM
- El economista Brian Jabarian, de la University of Chicago, quien asesora transformaciones empresariales con IA, dijo que ya se acerca la hora de la factura
La IPO podría forzar un reajuste de precios
- OpenAI y Anthropic se están preparando para una IPO, y en ese proceso puede crecer la presión para reducir la brecha entre el precio de suscripción y el costo real
- Se reporta que Anthropic ya superó 30 mil millones de dólares en ingresos anualizados, al alza desde 9 mil millones de dólares a fines de 2025
- Se describe a OpenAI con un ritmo de ingresos de aproximadamente 25 mil millones de dólares
- OpenAI prevé 115 mil millones de dólares de consumo acumulado de efectivo para 2029 y se presenta que comprometió 665 mil millones de dólares en gasto de cómputo hasta 2030
- Se afirma que Oracle asumió 43 mil millones de dólares en deuda en un solo año fiscal para construir centros de datos para OpenAI
- Mientras siguen siendo empresas privadas quemando capital de riesgo, pueden subsidiar el costo de inferencia, operar modelos con pérdidas y mantener planes de 20 dólares al mes cuyo costo de prestación supera los 100 dólares
- Después de una IPO, el mercado público exigirá márgenes, los analistas exigirán economía unitaria y los inversionistas exigirán una ruta a la rentabilidad que no dependa de financiamiento infinito
- Las formas más rápidas de cerrar esa brecha de precios son subir precios, limitar el uso o pasar a cobro basado en consumo, y las tres podrían afectar fuertemente a los suscriptores empresariales actuales
Señales de reajuste de precios que ya están apareciendo
- GitHub pasará a cobro por uso el 1 de junio de 2026, reemplazando las solicitudes premium de tarifa plana por AI Credits basados en tokens
- Microsoft subió el precio de Microsoft 365 dos veces en 4 años, y el aumento más reciente está ligado directamente al costo de infraestructura de IA
- OpenAI introdujo un tier Pro de 100 dólares como nuevo nivel de precio real para usuarios intensivos
- El tier Max de 200 dólares al mes de Anthropic es un ejemplo de cuánto podría costar realmente un uso definido cuando se acaben los subsidios
- Geoff Webb, VP de Conga, dijo que la competencia por liderar el mercado de IA es tan grande, y el costo de dominarla también, que es muy probable que ocurran rápidamente cambios importantes en los modelos de negocio y en los precios del servicio a medida que las compañías moneticen y busquen recuperar la inversión
Lo que deben hacer ahora los líderes empresariales
- Las empresas deben auditar el consumo real de tokens por equipo, no solo contar asientos
- Deben modelar cómo cambiaría el costo de IA bajo escenarios de 2x, 5x y 10x frente al precio actual
- Deben construir opcionalidad de proveedores dentro de su stack para que un cambio de precio de un solo proveedor no destruya repentinamente el presupuesto
- Deben discutir la brecha de costos de IA con el CFO antes de que el CFO plantee el problema primero
- La diferencia entre lo que una organización paga hoy por IA y lo que pagará dentro de 18 meses puede convertirse en uno de los mayores incrementos de gasto que muchas empresas tendrán que absorber
- Algunas empresas podrían tener que explicar cómo una herramienta que antes costaba menos que el almuerzo del equipo de pronto pasó a requerir un presupuesto anual de seis cifras
- La era de los subsidios está llegando a su fin, y muchas empresas todavía ni siquiera han empezado esta conversación
4 comentarios
Parece el mismo tema que en la época del mainframe..
Si se da esa dinámica de que los servidores son caros y los recursos escasean, mientras que las computadoras personales son lentas,
al final los servidores también se abaratarán y las computadoras personales también mejorarán su rendimiento... creo que el tiempo dará la respuesta.
Si es caro, basta con no usarlo..
Como asumen que igual lo vamos a pagar aunque sea caro, los proveedores de LLM están subiendo los precios. Me da curiosidad ver qué va a pasar de aquí en adelante con LLM open source como GLM, qwen y deepseek. La gente va a empezar a hacer cuentas sobre si de verdad vale la pena pagar estos precios para usar modelos frontier, o si más bien conviene usar open source incluso haciendo el esfuerzo de implementar su propia infraestructura con vLLM.
Opiniones de Hacker News
Todas las suscripciones de IA son como una bomba de tiempo para los proveedores de modelos frontier
En unos años será posible ejecutar modelos locales tan buenos como los modelos frontier de hoy con casi ningún costo, y la base del mercado empresarial de las compañías frontier se derrumbará
Tan solo los requisitos de memoria ya son enormes, y por un buen tiempo seguirá siendo mucho más eficiente en costos usar hardware de hosting especializado y compartido con alta utilización
Tienen que seguir mejorando para mantenerse por delante entre sí y de los modelos de pesos abiertos, así que en realidad se parecen más a lo contrario de una bomba de tiempo
Los tokens de inferencia del nivel actual seguirán abaratándose, y no sé si lo local será el estado final porque los requisitos de hardware son altos, pero la competencia tiende a empujar los márgenes de ganancia hacia 0
Una discusión larga sobre este tema: https://corecursive.com/the-pre-training-wall-and-the-treadm...
Estoy monitoreando el uso de tokens y moviéndome activamente para bajar los costos de inferencia e internalizarlos, en vez de gastar tokens a lo bruto
Mi jefe quedó muy satisfecho, y ahora lo estamos desplegando más ampliamente. Creo que ese es el futuro
Las leyes de escalado ya se han vuelto pesadas, y no hay que dejarse llevar por la exageración de lo “exponencial”
Además, el competidor real son los modelos frontier de dentro de 2 años
Hoy se necesita hardware más grande, más caro y que consume más energía que hace 1 o 2 años
El tono exagerado de los textos de ambos bandos sobre IA ya cansa demasiado
Me gustaría pararme frente a un pizarrón con alguien que realmente entienda bien la economía y el negocio de los proveedores de tokens y preguntarle “como si tuviera cinco años”
Quiero saber si para el proveedor de tokens esto es un juego de márgenes y para el consumidor es un juego de calidad de servicio/producto, y si, si en algún momento la línea entre calidad y margen se cruza, esto es una carrera por llegar a ese punto antes de que se acabe el dinero; y, de ser así, si hay casos históricos donde la diferencia entre ambas cosas haya sido muy grande
Los LLM parecen únicos en que prácticamente no tienen un límite claro de “qué tanto mejor esperan que se pongan” los consumidores, y no son como servicios fáciles de escalar en términos de recursos computacionales, como el correo electrónico
Es una pregunta muy básica, pero también me pregunto por qué querrían hacer un IPO antes de tener un modelo de negocio sostenible. ¿Cuál es la ventaja?
Según los enlaces compartidos aquí, cerca del 30% del gasto de Anthropic es inferencia, y el otro 70% es I+D, como el desarrollo del siguiente modelo
Si reflejas eso y le agregas una ganancia, simplificando los números, bastaría vender a alrededor de 1 dólar por millón de tokens para ganar dinero
El precio actual del API es de 25 dólares por millón de tokens, así que no tengo dudas de que hay rentabilidad
En cambio, si se exprime al máximo el plan Max de 200 dólares al mes, podría llegar a 10 mil millones de tokens mensuales, lo que sería 0.02 dólares por millón de tokens, o sea una pérdida enorme que en algún momento desaparecerá
Pero si alguien usa, digamos, 100 millones de tokens al mes en un plan de Anthropic de 100 dólares al mes, la empresa sí gana dinero
Para usar 10 mil millones de tokens al mes tendrías que trabajar muchísimo y ser realmente muy hábil usando IA, y alguien así probablemente ya lleva años usándola y le sacaba provecho incluso antes de Opus
Perder Opus le decepcionaría, pero ese tipo de usuario justamente también sabría aprovechar bien modelos menos potentes, así que en unos años podría cambiarse a un modelo open source alojado internamente y aun así obtener un nivel parecido al actual de 0.02 dólares por millón de tokens
Por eso no me convence el tono pesimista del texto. La situación cambiará, pero eso no significa el fin del uso de IA
Estoy de acuerdo con el sentimiento del texto, pero el estilo se siente demasiado hecho por LLM
Sobre todo la estructura de las secciones y punchlines como “That is not a rounding error. That is a line item that needs its own budget code.”
Es bastante irritante, y con el mismo prompt no lo he visto tanto en Gemini
No trae nombre de autor
Brad Gerstner confirmó que los tokens no se están vendiendo con pérdida
Sin importar cómo separen la fórmula entre API y suscripciones, las empresas sí están generando utilidad sobre la venta pura de tokens
Puede que estén en pérdidas si cuentas salarios y compensación en acciones, pero los tokens en sí hoy sí son rentables
Puede que en este momento sea cierto, pero no fue así como llegó hasta aquí
La inversión por recuperar es de billones de dólares y los ingresos, con suerte, son de apenas decenas de miles de millones, así que no cuadra la idea de que los tokens vayan a dar ganancias en el corto plazo
La inferencia no solo tiene que ser rentable por sí sola, también tiene que cubrir ese costo
[0] https://epoch.ai/data-insights/openai-compute-spend
Las pérdidas se están pateando hacia adelante dentro de una estructura extraña de financiamiento circular, y en algún momento eso probablemente colapse en una crisis de deuda
Creo que ahí sí hay un subsidio fuerte, aunque son de las pocas cosas donde realmente percibo valor
El problema de toda la “IA” es que es muy fácil vivir sin ella
Las empresas de IA lo saben, los usuarios lo saben, y hasta el gerente más favorable a los agentes de IA lo sabe
Si imaginamos quitar toda la IA del mundo ahora mismo, el resultado sería simplemente seguir trabajando como siempre
El texto no enfatiza eso lo suficiente. ¿Se supone que debemos temer el día en que haya que volver a poner a ingenieros reales a revisar los PR?
Conforme la tecnología se integra más profundamente, eso deja de ser cierto
También se habría podido decir lo mismo pocos años después de la llegada del motor eléctrico: simplemente habríamos vuelto al vapor
Pero hoy, si intentaras vivir sin motores eléctricos, la sociedad colapsaría
La pregunta no es si hoy podemos vivir sin esto, sino si también podremos hacerlo dentro de 5 a 10 años, cuando esté completamente integrado
No para generar ingresos honestos, sino para incrustar los productos de IA tan profundamente que “simplemente quitarlos” deje de verse como una opción
Incluso si el costo de mantenimiento sigue subiendo hasta ir más allá de niveles tipo rescate gubernamental de aerolíneas
Es una nueva capa intermediaria de extracción de riqueza vendida con promesas falsas
Al menos para escribir JavaScript, no podría vivir sin IA
Como si fuera una mascota que se muere si no la atiendes de vez en cuando
Este texto está equivocado. No es que estas suscripciones no se ofrezcan a empresas
Las compañías están pagando montos mucho más cercanos al precio del API
La estrategia es acostumbrar a la gente a tokens ilimitados en la suscripción personal, esperando que ese comportamiento luego se traslade al trabajo
Los asientos de equipo o enterprise cuestan más que el precio para consumidor, pero siguen siendo de precio fijo con límites de uso que se reinician
Puedes asignar a miembros asientos equivalentes a los planes de 20/100/200 dólares al mes, o también hacerlo todo por consumo
Hay varias formas de comprarlo
También hay planes por consumo equivalentes a los planes de consumidor correspondientes
En la empresa donde trabajo nos cobran según uso del API
“En términos generales, el patrón es el mismo. Precio para adopción, no para economía. Amarra a las organizaciones. Convierte la IA en una parte estructural del trabajo diario de cada equipo. Ya luego se verá la factura.”
10 mil dólares al mes no es nada despreciable, pero si con eso apoyas a un equipo de 10 a 20 ingenieros, es un apalancamiento bastante bueno
No leí el original completo, pero sí pude notar que lo escribió una IA
OpenRouter quizá podría servir como punto de referencia del costo base del proveedor de IA
Sigo escuchando que ofrece mejor relación costo-beneficio que Claude, y si es así, parecería implicar que Anthropic es particularmente ineficiente o que está obteniendo ganancia en inferencia
Puede que pierdan dinero en entrenamiento, pero eso posiblemente sea el costo de seguir siendo un laboratorio líder
Si una empresa colapsa por deuda u otras razones, ¿no podrían las empresas simplemente cambiarse a otra?
Si vuelvo a ver una sola vez más frases como “It’s not X. It’s Y.” o el uso metafórico de “load-bearing”, voy a vomitar
“La era del subsidio no está terminando con elegancia. Está mostrando grietas por todas partes.”
“La pregunta no es si fue un buen trato. Es cuánto tiempo podrá sostenerse.”
“Un desarrollador que corre tres o cuatro agentes de código al mismo tiempo no usa 3x o 4x los tokens de una conversación de chat. Usa un orden de magnitud más, no una sola cifra más.”
“Estas ya no son experimentos. Son flujos de trabajo estructurales.”
“Eso no es un error de redondeo. Es una partida que necesita su propio código presupuestario.”
Al menos podemos tener esa esperanza
Tenía datos y la lógica parecía razonable, pero llegando a la mitad empiezan a aparecer ejemplo de tendencia, otro ejemplo, un tercer ejemplo, y el “eso no es simplemente X sino Y”
Es tan irritante como estar leyendo un buen texto, hacer clic en el enlace de la fuente y terminar en un rickroll
Los clientes enterprise no están usando una suscripción Claude Pro de 20 dólares al mes
En nuestra empresa damos a cada desarrollador un límite de uso equivalente a unos 1,000 dólares al mes, y por lo que veo el ahorro frente al costo del API es de como mucho 30%
No es un nivel de subsidio descabellado
En otros puestos muchas veces solo se permiten 50 dólares al mes, y esa gente sigue topando el límite
GitHub Copilot ha venido funcionando así en sus asientos business y enterprise, pero pronto va a topar con un límite
Creo que después de junio, cuando reorganicen las cuentas Pro y Pro+ de consumidor, se pondrán al día rápido
OpenAI parece estar regalando tokens para amarrar a los clientes, así que lo que más me preocupa es un cambio brusco en precios y condiciones por parte de OpenAI después del IPO
Anthropic ya se está moviendo de forma responsable en este tema, y GitHub Copilot también está tratando de corregir sus subsidios excesivos en los próximos meses
Porque cobraba por “solicitud” y no por token
Una sola solicitud de 3 centavos podía quemar más de 20 dólares en tokens, y ese esquema termina este mes
Yo también estaba preocupado porque he venido procesando bloques grandes de trabajo con GHCP, pero al ver el nuevo estimador de facturación, resultó que a precio de API eran unos 150 a 200 dólares al mes
Sigue siendo un subsidio sobre una suscripción de 20 dólares al mes, pero no es una locura total
Si usas mucho y de forma responsable herramientas de coding agent, probablemente te quedes alrededor de 200 dólares al mes a precio de API
Si a ese precio el proveedor todavía gana dinero, para una empresa en Occidente que contrata desarrolladores no es difícil de aceptar considerando el tiempo que se ahorra
El verdadero riesgo está en los vibe coders con proyectos personales
La era de construir apps enormes abusando de planes subsidiados está llegando a su fin
Si realmente reemplaza a un desarrollador, tiene sentido que cueste más de 20 o 100 dólares al mes
El verdadero problema de las empresas de LLM es que todavía no han demostrado valor fuera de la programación
Si no logran eso, van a degradarse a simples herramientas de coding
Por eso tienen tanta prisa ahora, y la clave es qué flujos de trabajo pueden automatizar más
Tal vez puedan automatizar por completo todo el trabajo de papeleo
Si otras áreas se desarrollan, cambiarán el modelo de precios
Eso sí podría tener valor