Las suscripciones de IA son una bomba de tiempo para las empresas

(thestateofbrand.com)

7 puntos por GN⁺ 2026-05-18 | 7 comentarios | Compartir por WhatsApp

OpenAI, Anthropic y Google, entre otros, están ofreciendo a las empresas precios de suscripción por debajo del costo real de prestación, lo que puede generar un fuerte impacto de costos cuando ajusten los precios
La tarifa plana de 20 dólares al mes de Claude Pro y ChatGPT Plus puede escalar, para usuarios intensivos, a un costo real equivalente por API de 200 a 400 dólares mensuales por asiento
La IA agéntica incrementa fuertemente el consumo de tokens al operar de forma autónoma durante largos periodos, y GitHub Copilot también pasará a cobro por uso en junio de 2026
El costo de suscripción mensual de 1,000 dólares para un equipo de 50 personas puede convertirse en 15,000 a 40,000 dólares al mes medido por consumo real de tokens, aumentando la exposición presupuestaria
Los preparativos de OpenAI y Anthropic para una IPO aumentan la presión sobre los márgenes y la economía unitaria, lo que podría acelerar alzas de precios, límites de uso o el cambio a cobro basado en consumo

La brecha entre el precio de suscripción de IA y el costo real

Los principales proveedores de IA como OpenAI, Anthropic y Google están ofreciendo servicios a clientes empresariales con precios de suscripción inferiores al costo real de prestación, y si las empresas toman ese precio como referencia permanente y construyen sus flujos de trabajo sobre esa base, podrían recibir un fuerte golpe de costos cuando haya ajustes de precios
Claude Pro ofrece por 20 dólares al mes Sonnet 4.6, Opus 4.6, búsqueda web, ejecución de código, generación de archivos y aproximadamente 5 veces más uso que el nivel gratuito
En API, Sonnet 4.6 cuesta 3 dólares por cada millón de tokens de entrada y 15 dólares por cada millón de tokens de salida, mientras que Opus 4.6 cuesta 5 dólares por cada millón de tokens de entrada y 25 dólares por cada millón de tokens de salida
Si un trabajador del conocimiento usa Claude varias horas al día para subir documentos, redactar reportes y hacer análisis de datos, puede consumir millones de tokens por semana, lo que al convertirlo a tarifas de API puede subir hasta 200 a 400 dólares mensuales por asiento
Se reportó que Microsoft perdió más de 20 dólares al mes por usuario con GitHub Copilot, y que el costo de cómputo de usuarios intensivos con una suscripción mensual de 10 dólares llegó hasta 80 dólares
También hay análisis que señalan que los usuarios de Anthropic consumieron más de 8 dólares de cómputo por cada 1 dólar de ingresos por suscripción, y Nick Turley, VP de producto de OpenAI, describió la estructura de precios de suscripción como algo que se asentó por accidente y comparó la posible eliminación gradual de los planes ilimitados con el uso ilimitado de electricidad
ChatGPT Plus ha mantenido el precio de 20 dólares al mes durante 3 años, pero en ese tiempo agregó funciones como generación de imágenes, interpretación de código, modo de voz, razonamiento agéntico y búsqueda web

Estrategia común de precios entre los principales proveedores

Google incluye Gemini Advanced dentro de Google One AI Premium por 20 dólares al mes, mientras cobra aparte el acceso vía API al mismo modelo
Meta ofrece Llama gratis y subsidia con ingresos publicitarios el costo de cómputo de cientos de millones de consultas de IA generadas en sus propias plataformas
Grok de xAI fijó un precio de entrada de API tan bajo como 0.20 dólares por millón de tokens, y se le describe como una estructura que acepta pérdidas para ganar participación de mercado
El patrón común es fijar precios orientados a expandir la adopción más que a la rentabilidad, amarrar a las organizaciones, volver la IA un componente central de la operación diaria de cada equipo y dejar el problema del costo para después
OpenAI está perdiendo dinero con los suscriptores de consumo y, según reportes, está evaluando un cambio de estrategia para enfocarse más en el segmento empresarial, donde la economía unitaria es relativamente menos mala
Según The Wall Street Journal, OpenAI no alcanzó metas clave de ingresos y usuarios en su camino hacia una IPO, y el esquema de precios subsidiados también empieza a mostrar grietas

La IA agéntica empeora la estructura de costos

En el uso de chatbots, preguntas y respuestas generaban un consumo de tokens relativamente predecible, pero la IA agéntica aumenta mucho el uso de tokens al operar de forma autónoma durante largos periodos
Las sesiones de Claude Code se ejecutan de forma autónoma durante largos periodos y consumen tokens a una velocidad mucho mayor que el uso interactivo
Algunos usuarios reportaron haber agotado una ventana de límite de velocidad de 5 horas en solo 90 minutos
GitHub anunció que moverá Copilot a cobro por uso a partir del 1 de junio de 2026 porque el modelo de tarifa plana colapsó bajo cargas de trabajo agénticas
GitHub explicó que Copilot ha evolucionado de forma importante y que el uso agéntico "se está volviendo el valor predeterminado", elevando así las necesidades de cómputo y razonamiento
Sam Altman ha dicho públicamente que OpenAI ahora debe convertirse en una empresa de razonamiento de IA, lo que conecta con la idea de que el uso agéntico requiere un modelo económico fundamentalmente distinto
En equipos de ingeniería, los Agent Teams, donde múltiples instancias de IA trabajan en paralelo sobre un mismo proyecto, disparan el gasto: si un desarrollador ejecuta 3 o 4 agentes de código al mismo tiempo, el uso de tokens puede crecer no solo varias veces frente a una conversación simple, sino más de un orden de magnitud

La exposición de costos que las empresas no están midiendo

En los últimos 2 años, muchas empresas han integrado las suscripciones de IA profundamente en la operación: marketing redacta copys con ChatGPT Plus, ingeniería escribe y revisa código con Claude Pro, y los equipos de research, customer success y finanzas también usan IA para resumir documentos, tickets y modelar escenarios
Si 50 personas usan Claude Pro, hoy el costo es de 1,000 dólares al mes, y ChatGPT Plus está en un rango similar, por lo que la IA parece una partida pequeña dentro del estado de resultados
Pero si se calcula el uso real por API de ese mismo equipo según consumo de tokens, el costo puede subir a 15,000 a 40,000 dólares mensuales según la intensidad de uso, convirtiéndose en una partida que necesita un código presupuestario propio
Cuando el precio se ajuste, las empresas que asumieron que una IA de 20 dólares al mes era un insumo permanentemente barato podrían recibir facturas no previstas justo cuando ya es difícil retirarla del flujo de trabajo por su nivel de integración
El subsidio crea dependencia, y la dependencia se convierte en una trampa corporativa que hace más difícil evitar subidas de precio
Q1 2026 AI Quarterly Pulse de KPMG estima que las organizaciones en Estados Unidos esperan gastar en promedio 207 millones de dólares en IA durante los próximos 12 meses, casi el doble que en el mismo periodo del año anterior
Según una encuesta de Goldman Sachs Research, muchas grandes empresas ya están excediendo sus presupuestos de IA por márgenes de múltiples dígitos, y el gasto en IA podría acercarse al costo de las nóminas de ingeniería en el futuro cercano
Swami Chandrasekaran, líder del AI & Data Lab de KPMG North America, dijo a Marketplace que hace apenas uno o dos trimestres casi nadie prestaba atención al costo de consumo de LLM
El economista Brian Jabarian, de la University of Chicago, quien asesora transformaciones empresariales con IA, dijo que ya se acerca la hora de la factura

La IPO podría forzar un reajuste de precios

OpenAI y Anthropic se están preparando para una IPO, y en ese proceso puede crecer la presión para reducir la brecha entre el precio de suscripción y el costo real
Se reporta que Anthropic ya superó 30 mil millones de dólares en ingresos anualizados, al alza desde 9 mil millones de dólares a fines de 2025
Se describe a OpenAI con un ritmo de ingresos de aproximadamente 25 mil millones de dólares
OpenAI prevé 115 mil millones de dólares de consumo acumulado de efectivo para 2029 y se presenta que comprometió 665 mil millones de dólares en gasto de cómputo hasta 2030
Se afirma que Oracle asumió 43 mil millones de dólares en deuda en un solo año fiscal para construir centros de datos para OpenAI
Mientras siguen siendo empresas privadas quemando capital de riesgo, pueden subsidiar el costo de inferencia, operar modelos con pérdidas y mantener planes de 20 dólares al mes cuyo costo de prestación supera los 100 dólares
Después de una IPO, el mercado público exigirá márgenes, los analistas exigirán economía unitaria y los inversionistas exigirán una ruta a la rentabilidad que no dependa de financiamiento infinito
Las formas más rápidas de cerrar esa brecha de precios son subir precios, limitar el uso o pasar a cobro basado en consumo, y las tres podrían afectar fuertemente a los suscriptores empresariales actuales

Señales de reajuste de precios que ya están apareciendo

GitHub pasará a cobro por uso el 1 de junio de 2026, reemplazando las solicitudes premium de tarifa plana por AI Credits basados en tokens
Microsoft subió el precio de Microsoft 365 dos veces en 4 años, y el aumento más reciente está ligado directamente al costo de infraestructura de IA
OpenAI introdujo un tier Pro de 100 dólares como nuevo nivel de precio real para usuarios intensivos
El tier Max de 200 dólares al mes de Anthropic es un ejemplo de cuánto podría costar realmente un uso definido cuando se acaben los subsidios
Geoff Webb, VP de Conga, dijo que la competencia por liderar el mercado de IA es tan grande, y el costo de dominarla también, que es muy probable que ocurran rápidamente cambios importantes en los modelos de negocio y en los precios del servicio a medida que las compañías moneticen y busquen recuperar la inversión

Lo que deben hacer ahora los líderes empresariales

Las empresas deben auditar el consumo real de tokens por equipo, no solo contar asientos
Deben modelar cómo cambiaría el costo de IA bajo escenarios de 2x, 5x y 10x frente al precio actual
Deben construir opcionalidad de proveedores dentro de su stack para que un cambio de precio de un solo proveedor no destruya repentinamente el presupuesto
Deben discutir la brecha de costos de IA con el CFO antes de que el CFO plantee el problema primero
La diferencia entre lo que una organización paga hoy por IA y lo que pagará dentro de 18 meses puede convertirse en uno de los mayores incrementos de gasto que muchas empresas tendrán que absorber
Algunas empresas podrían tener que explicar cómo una herramienta que antes costaba menos que el almuerzo del equipo de pronto pasó a requerir un presupuesto anual de seis cifras
La era de los subsidios está llegando a su fin, y muchas empresas todavía ni siquiera han empezado esta conversación

7 comentarios

hmmhmmhm 2026-05-18

Parece el mismo tema que en la época del mainframe..
Si se da esa dinámica de que los servidores son caros y los recursos escasean, mientras que las computadoras personales son lentas,
al final los servidores también se abaratarán y las computadoras personales también mejorarán su rendimiento... creo que el tiempo dará la respuesta.

GN⁺ 2026-05-18

Opiniones de Hacker News

Todas las suscripciones de IA son como una bomba de tiempo para los proveedores de modelos frontier
En unos años será posible ejecutar modelos locales tan buenos como los modelos frontier de hoy con casi ningún costo, y la base del mercado empresarial de las compañías frontier se derrumbará
- No sé cuál es la base para decir que “en unos años ejecutaremos modelos locales tan buenos como los modelos frontier de hoy”
  Tan solo los requisitos de memoria ya son enormes, y por un buen tiempo seguirá siendo mucho más eficiente en costos usar hardware de hosting especializado y compartido con alta utilización
- Dicho de otra forma, los modelos frontier son activos que pierden valor muy rápido por la competencia del mercado
  Tienen que seguir mejorando para mantenerse por delante entre sí y de los modelos de pesos abiertos, así que en realidad se parecen más a lo contrario de una bomba de tiempo
  Los tokens de inferencia del nivel actual seguirán abaratándose, y no sé si lo local será el estado final porque los requisitos de hardware son altos, pero la competencia tiende a empujar los márgenes de ganancia hacia 0
  Una discusión larga sobre este tema: https://corecursive.com/the-pre-training-wall-and-the-treadm...
- En el último mes armé un pequeño demo conectando Qwen, Gemma y Deepseek detrás de LiteLLM para mostrar cómo podría verse el futuro
  Estoy monitoreando el uso de tokens y moviéndome activamente para bajar los costos de inferencia e internalizarlos, en vez de gastar tokens a lo bruto
  Mi jefe quedó muy satisfecho, y ahora lo estamos desplegando más ampliamente. Creo que ese es el futuro
- La idea de que en unos años ejecutaremos modelos locales tan buenos como los modelos frontier de hoy es muy dudosa
  Las leyes de escalado ya se han vuelto pesadas, y no hay que dejarse llevar por la exageración de lo “exponencial”
  Además, el competidor real son los modelos frontier de dentro de 2 años
- A menos que haya un avance importante en producción de hardware o en arquitectura de modelos, en realidad es al revés
  Hoy se necesita hardware más grande, más caro y que consume más energía que hace 1 o 2 años
El tono exagerado de los textos de ambos bandos sobre IA ya cansa demasiado
Me gustaría pararme frente a un pizarrón con alguien que realmente entienda bien la economía y el negocio de los proveedores de tokens y preguntarle “como si tuviera cinco años”
Quiero saber si para el proveedor de tokens esto es un juego de márgenes y para el consumidor es un juego de calidad de servicio/producto, y si, si en algún momento la línea entre calidad y margen se cruza, esto es una carrera por llegar a ese punto antes de que se acabe el dinero; y, de ser así, si hay casos históricos donde la diferencia entre ambas cosas haya sido muy grande
Los LLM parecen únicos en que prácticamente no tienen un límite claro de “qué tanto mejor esperan que se pongan” los consumidores, y no son como servicios fáciles de escalar en términos de recursos computacionales, como el correo electrónico
Es una pregunta muy básica, pero también me pregunto por qué querrían hacer un IPO antes de tener un modelo de negocio sostenible. ¿Cuál es la ventaja?
- Le pregunté a una IA el costo de producir tokens de Opus y me respondió que era de 0.216 dólares por millón de tokens, incluyendo hardware, electricidad, enfriamiento y hosting
  Según los enlaces compartidos aquí, cerca del 30% del gasto de Anthropic es inferencia, y el otro 70% es I+D, como el desarrollo del siguiente modelo
  Si reflejas eso y le agregas una ganancia, simplificando los números, bastaría vender a alrededor de 1 dólar por millón de tokens para ganar dinero
  El precio actual del API es de 25 dólares por millón de tokens, así que no tengo dudas de que hay rentabilidad
  En cambio, si se exprime al máximo el plan Max de 200 dólares al mes, podría llegar a 10 mil millones de tokens mensuales, lo que sería 0.02 dólares por millón de tokens, o sea una pérdida enorme que en algún momento desaparecerá
  Pero si alguien usa, digamos, 100 millones de tokens al mes en un plan de Anthropic de 100 dólares al mes, la empresa sí gana dinero
  Para usar 10 mil millones de tokens al mes tendrías que trabajar muchísimo y ser realmente muy hábil usando IA, y alguien así probablemente ya lleva años usándola y le sacaba provecho incluso antes de Opus
  Perder Opus le decepcionaría, pero ese tipo de usuario justamente también sabría aprovechar bien modelos menos potentes, así que en unos años podría cambiarse a un modelo open source alojado internamente y aun así obtener un nivel parecido al actual de 0.02 dólares por millón de tokens
  Por eso no me convence el tono pesimista del texto. La situación cambiará, pero eso no significa el fin del uso de IA
Estoy de acuerdo con el sentimiento del texto, pero el estilo se siente demasiado hecho por LLM
Sobre todo la estructura de las secciones y punchlines como “That is not a rounding error. That is a line item that needs its own budget code.”
- Claude de verdad genera muchísimo ese tipo de frases
  Es bastante irritante, y con el mismo prompt no lo he visto tanto en Gemini
- Para empezar, no sé quién escribió este texto
  No trae nombre de autor
- Pangram marcó este texto con alta confianza como 100% generado por IA
Brad Gerstner confirmó que los tokens no se están vendiendo con pérdida
Sin importar cómo separen la fórmula entre API y suscripciones, las empresas sí están generando utilidad sobre la venta pura de tokens
Puede que estén en pérdidas si cuentas salarios y compensación en acciones, pero los tokens en sí hoy sí son rentables
- Es como ver un cohete con los motores más potentes del planeta apagar los motores una vez que sale de la órbita y decir “está volando sin potencia”
  Puede que en este momento sea cierto, pero no fue así como llegó hasta aquí
  La inversión por recuperar es de billones de dólares y los ingresos, con suerte, son de apenas decenas de miles de millones, así que no cuadra la idea de que los tokens vayan a dar ganancias en el corto plazo
- Los tokens pueden venderse con margen, pero el 70% del gasto en cómputo se va en I+D y entrenamiento de modelos[0]
  La inferencia no solo tiene que ser rentable por sí sola, también tiene que cubrir ese costo
  [0] https://epoch.ai/data-insights/openai-compute-spend
- No los están vendiendo con pérdida, pero tampoco los están vendiendo lo suficientemente caros como para cubrir las pérdidas y costos actuales
  Las pérdidas se están pateando hacia adelante dentro de una estructura extraña de financiamiento circular, y en algún momento eso probablemente colapse en una crisis de deuda
- En otras palabras, las empresas de IA tienen utilidad positiva antes de descontar costos
- No sé si eso también aplique a los tokens de Claude Code o Codex
  Creo que ahí sí hay un subsidio fuerte, aunque son de las pocas cosas donde realmente percibo valor
El problema de toda la “IA” es que es muy fácil vivir sin ella
Las empresas de IA lo saben, los usuarios lo saben, y hasta el gerente más favorable a los agentes de IA lo sabe
Si imaginamos quitar toda la IA del mundo ahora mismo, el resultado sería simplemente seguir trabajando como siempre
El texto no enfatiza eso lo suficiente. ¿Se supone que debemos temer el día en que haya que volver a poner a ingenieros reales a revisar los PR?
- Creo que eso siempre pasa al inicio de la adopción de una nueva tecnología
  Conforme la tecnología se integra más profundamente, eso deja de ser cierto
  También se habría podido decir lo mismo pocos años después de la llegada del motor eléctrico: simplemente habríamos vuelto al vapor
  Pero hoy, si intentaras vivir sin motores eléctricos, la sociedad colapsaría
  La pregunta no es si hoy podemos vivir sin esto, sino si también podremos hacerlo dentro de 5 a 10 años, cuando esté completamente integrado
- Justamente por eso quizá lo están empujando con más fuerza
  No para generar ingresos honestos, sino para incrustar los productos de IA tan profundamente que “simplemente quitarlos” deje de verse como una opción
  Incluso si el costo de mantenimiento sigue subiendo hasta ir más allá de niveles tipo rescate gubernamental de aerolíneas
  Es una nueva capa intermediaria de extracción de riqueza vendida con promesas falsas
- Si usas JavaScript, claro que sí
  Al menos para escribir JavaScript, no podría vivir sin IA
- Siempre se siente raro ver que recomiendan usar herramientas de IA incluso para tareas totalmente normales y genéricas
  Como si fuera una mascota que se muere si no la atiendes de vez en cuando
Este texto está equivocado. No es que estas suscripciones no se ofrezcan a empresas
Las compañías están pagando montos mucho más cercanos al precio del API
La estrategia es acostumbrar a la gente a tokens ilimitados en la suscripción personal, esperando que ese comportamiento luego se traslade al trabajo
- Sí se ofrecen
  Los asientos de equipo o enterprise cuestan más que el precio para consumidor, pero siguen siendo de precio fijo con límites de uso que se reinician
  Puedes asignar a miembros asientos equivalentes a los planes de 20/100/200 dólares al mes, o también hacerlo todo por consumo
  Hay varias formas de comprarlo
- Las suscripciones sí se ofrecen claramente a empresas
  También hay planes por consumo equivalentes a los planes de consumidor correspondientes
- Me confundió por qué estaban hablando de suscripciones para empresas
  En la empresa donde trabajo nos cobran según uso del API
- Al ver párrafos así, se parece más a un texto que escupió una IA
  “En términos generales, el patrón es el mismo. Precio para adopción, no para economía. Amarra a las organizaciones. Convierte la IA en una parte estructural del trabajo diario de cada equipo. Ya luego se verá la factura.”
- Además de eso, la magnitud de los cobros de API por la que el texto se escandaliza sigue siendo relativamente menor
  10 mil dólares al mes no es nada despreciable, pero si con eso apoyas a un equipo de 10 a 20 ingenieros, es un apalancamiento bastante bueno
No leí el original completo, pero sí pude notar que lo escribió una IA
OpenRouter quizá podría servir como punto de referencia del costo base del proveedor de IA
Sigo escuchando que ofrece mejor relación costo-beneficio que Claude, y si es así, parecería implicar que Anthropic es particularmente ineficiente o que está obteniendo ganancia en inferencia
Puede que pierdan dinero en entrenamiento, pero eso posiblemente sea el costo de seguir siendo un laboratorio líder
Si una empresa colapsa por deuda u otras razones, ¿no podrían las empresas simplemente cambiarse a otra?
Si vuelvo a ver una sola vez más frases como “It’s not X. It’s Y.” o el uso metafórico de “load-bearing”, voy a vomitar
- He sacado bastantes de esas expresiones, y no es una lista corta
  “La era del subsidio no está terminando con elegancia. Está mostrando grietas por todas partes.”
  “La pregunta no es si fue un buen trato. Es cuánto tiempo podrá sostenerse.”
  “Un desarrollador que corre tres o cuatro agentes de código al mismo tiempo no usa 3x o 4x los tokens de una conversación de chat. Usa un orden de magnitud más, no una sola cifra más.”
  “Estas ya no son experimentos. Son flujos de trabajo estructurales.”
  “Eso no es un error de redondeo. Es una partida que necesita su propio código presupuestario.”
- Si llega un gran ajuste de precios, mucha gente que generaba comentarios en redes sociales con suscripciones gratis o de 20 dólares al mes quizá vuelva a escribirlos por su cuenta al ver el costo real
  Al menos podemos tener esa esperanza
- También me cae mal eso de decir “the unlock”
- Este texto empezó bien
  Tenía datos y la lógica parecía razonable, pero llegando a la mitad empiezan a aparecer ejemplo de tendencia, otro ejemplo, un tercer ejemplo, y el “eso no es simplemente X sino Y”
  Es tan irritante como estar leyendo un buen texto, hacer clic en el enlace de la fuente y terminar en un rickroll
Los clientes enterprise no están usando una suscripción Claude Pro de 20 dólares al mes
En nuestra empresa damos a cada desarrollador un límite de uso equivalente a unos 1,000 dólares al mes, y por lo que veo el ahorro frente al costo del API es de como mucho 30%
No es un nivel de subsidio descabellado
En otros puestos muchas veces solo se permiten 50 dólares al mes, y esa gente sigue topando el límite
GitHub Copilot ha venido funcionando así en sus asientos business y enterprise, pero pronto va a topar con un límite
Creo que después de junio, cuando reorganicen las cuentas Pro y Pro+ de consumidor, se pondrán al día rápido
OpenAI parece estar regalando tokens para amarrar a los clientes, así que lo que más me preocupa es un cambio brusco en precios y condiciones por parte de OpenAI después del IPO
Anthropic ya se está moviendo de forma responsable en este tema, y GitHub Copilot también está tratando de corregir sus subsidios excesivos en los próximos meses
- Solo GitHub Copilot estaba dando un subsidio realmente absurdo
  Porque cobraba por “solicitud” y no por token
  Una sola solicitud de 3 centavos podía quemar más de 20 dólares en tokens, y ese esquema termina este mes
  Yo también estaba preocupado porque he venido procesando bloques grandes de trabajo con GHCP, pero al ver el nuevo estimador de facturación, resultó que a precio de API eran unos 150 a 200 dólares al mes
  Sigue siendo un subsidio sobre una suscripción de 20 dólares al mes, pero no es una locura total
  Si usas mucho y de forma responsable herramientas de coding agent, probablemente te quedes alrededor de 200 dólares al mes a precio de API
  Si a ese precio el proveedor todavía gana dinero, para una empresa en Occidente que contrata desarrolladores no es difícil de aceptar considerando el tiempo que se ahorra
  El verdadero riesgo está en los vibe coders con proyectos personales
  La era de construir apps enormes abusando de planes subsidiados está llegando a su fin
Si realmente reemplaza a un desarrollador, tiene sentido que cueste más de 20 o 100 dólares al mes
El verdadero problema de las empresas de LLM es que todavía no han demostrado valor fuera de la programación
Si no logran eso, van a degradarse a simples herramientas de coding
Por eso tienen tanta prisa ahora, y la clave es qué flujos de trabajo pueden automatizar más
Tal vez puedan automatizar por completo todo el trabajo de papeleo
Si otras áreas se desarrollan, cambiarán el modelo de precios
- También están intentando en cierta medida reemplazar Figma
  Eso sí podría tener valor

taekim34 2026-05-19

Para ahorrar tokens, es importante poder verificar en tiempo real "cuánto estoy usando ahora". En particular, como la facturación basada en tokens, a diferencia de una suscripción, puede dispararse de forma no lineal según el patrón de uso, necesitas poder ver a nivel de sesión por dónde se está fugando el costo para poder reaccionar. Si usas un entorno de Claude Code, prueba cc-token-saver (https://github.com/ww-w-ai/cc-token-saver). Te muestra en tiempo real el costo por sesión y por tramo, bloquea automáticamente el costoso reenvío cuando expira la caché, e incluso delega automáticamente las tareas pesadas a SubTask de bajo costo.

iolothebard 2026-05-18

Al final, igual se va a usar.
El iPhone 3 costaba 200~300 dólares… ahora pasa de largo los 1000 dólares, pero igual lo usamos. Ya probamos el sabor.

prunusnira 2026-05-18

Parece que cada vez aumentará más la implementación de LLM locales.

master6559 2026-05-18

Si es caro, basta con no usarlo..

aer0700 2026-05-18

Como asumen que igual lo vamos a pagar aunque sea caro, los proveedores de LLM están subiendo los precios. Me da curiosidad ver qué va a pasar de aquí en adelante con LLM open source como GLM, qwen y deepseek. La gente va a empezar a hacer cuentas sobre si de verdad vale la pena pagar estos precios para usar modelos frontier, o si más bien conviene usar open source incluso haciendo el esfuerzo de implementar su propia infraestructura con vLLM.