4 puntos por GN⁺ 4 시간 전 | 1 comentarios | Compartir por WhatsApp
  • Los agentes de codificación y de propósito general de Anthropic y OpenAI muestran un mayor potencial de ingresos en cobro por uso empresarial que en suscripciones de consumo
  • Los usuarios intensivos de Claude Code y Codex consumen, con una suscripción mensual de $200, tokens equivalentes a $2,180.16 a precio de API, pero los clientes empresariales quedan fuera de descuentos similares
  • En abril de 2026, ambas compañías alinearon el costo Enterprise de Codex y Claude Code/Cowork con el precio público de la API y además lanzaron modelos frontier más caros
  • De 703 vacantes de OpenAI, 229, y de 390 de Anthropic, 105, se pueden clasificar como de ventas y soporte empresarial, lo que muestra un giro claro hacia ventas directas
  • La controversia por costos en Uber y Microsoft puede interpretarse no como un fracaso de la IA, sino como una señal de precio aceptable: a los clientes les pesa, pero aun así la usan

Los clientes empresariales empiezan a pagar precio de API

  • El plan Max de $100 al mes de Anthropic y el plan Pro de $100 al mes de OpenAI ofrecen una relación precio-beneficio muy favorable para usuarios intensivos de agentes de codificación
  • Si se convierte el uso de los últimos 30 días al precio de tokens de API con ccusage, Anthropic Claude Code equivale a $1,199.79 y OpenAI Codex a $980.37
    • Sumados, implican usar $2,180.16 en tokens por $200
    • La diferencia es grande incluso para el caso de un “usuario que lo usa bastante”, no solo alguien que mantiene agentes corriendo todo el día
  • La suposición de que las empresas recibirían descuentos similares al usar agentes a gran escala resultó ser incorrecta
  • Anthropic parece haber cambiado, en los últimos 6 meses, su plan Enterprise desde una estructura de “incluye suficiente uso para una jornada laboral típica” a un esquema de $20 al mes por asiento + cobro de API por uso
  • OpenAI también aplicó un cambio de precios similar en abril de 2026
    • Según la tabla de tarifas de Codex, el 2 de abril de 2026 el precio de Codex dejó de cobrarse por mensaje y pasó a ajustarse con base en uso de tokens de API
    • El cambio del 2 de abril aplicó a planes nuevos y existentes Plus, Pro, ChatGPT Business y a nuevos planes ChatGPT Enterprise
    • El 23 de abril también se aplicó a todos los planes ChatGPT Enterprise existentes, incluidos Edu, Health, Gov y ChatGPT for Teachers
    • El precio se muestra en “créditos”, pero parece coincidir con el costo de tokens de API por modelo
  • A abril de 2026, el costo Enterprise de OpenAI Codex y Anthropic Claude Code/Cowork pasó a ser igual al precio público de la API
  • Ese mismo mes, las dos empresas líderes en modelos también lanzaron modelos frontier más caros
    • GPT-5.5, lanzado el 23 de abril, cuesta el doble en API que GPT-5.4
    • Opus 4.7, lanzado el 16 de abril, es aproximadamente 1.4 veces más caro que Opus 4.6 si se considera el nuevo tokenizador
  • En abril de 2026 aparecieron al mismo tiempo el lanzamiento de modelos frontier más caros y el cambio para atar a clientes empresariales al precio de API en lugar de grandes descuentos previos

La conclusión de que llegaron al product-market fit

  • La ofensiva repentina de precios de Anthropic y OpenAI puede estar relacionada con preparativos para una IPO, pero el factor más importante parece ser que productos de agentes de codificación y de propósito general como Claude Code/Cowork y Codex encontraron product-market fit
  • ChatGPT logró popularidad masiva, pero convertir esa popularidad en ingresos fue difícil
  • Cobrar $10 a $20 al mes por usuario es un buen negocio, pero para cubrir el costo de una infraestructura de $1 billón se necesitaría sostener entre 1 y 2 mil millones de suscriptores durante 4 años
  • Una estructura donde empresas gastan más de $200 al mes por usuario puede traducirse mucho más rápido en ingresos grandes
    • Para usuarios avanzados, el uso ya equivale a cerca de $1,000 al mes en costo de API por proveedor
  • Los agentes de codificación consumen muchos más tokens, pero se están convirtiendo en herramientas cotidianas para profesionales especializados de altos salarios
    • Por ahora, principalmente ingenieros de software
    • Como permiten automatizar tareas que pueden procesarse introduciendo instrucciones en una computadora, también pueden aplicarse a un grupo más amplio de trabajadores del conocimiento calificados
  • Los modelos lanzados en noviembre de 2025 llevaron a los agentes a un nivel realmente útil, y en los 6 meses posteriores las empresas se fueron adaptando a esta tecnología y empezaron a aumentar el gasto real
  • Puede decirse que ChatGPT alcanzó product-market fit en febrero de 2023 al convertirse en la app de consumo de crecimiento más rápido de la historia, pero en ese momento no generó ingresos sustanciales
  • La combinación de agentes de codificación con precios empresariales parece marcar el punto en que estas empresas empezaron a generar ingresos muy reales

La expansión de contrataciones revela el enfoque empresarial

  • Las vacantes públicas de OpenAI y Anthropic también muestran señales de que los agentes empresariales ya aseguraron product-market fit
  • OpenAI tiene actualmente 703 vacantes, de las cuales 229, o 32.6%, se pueden clasificar como relacionadas con ventas y soporte empresarial
    • Incluye account executives, “Go To Market” y “Forward Deployed Engineers”, entre otros
  • Anthropic tiene 390 vacantes, de las cuales 105, o 26.9%, parecen de carácter empresarial
  • Resulta irónico que los laboratorios de IA hayan elegido un modelo de ventas empresariales que requiere mucho trabajo humano
    • Los contratos de ventas enterprise necesitan la participación de muchas personas para concretarse
  • El análisis de vacantes se hizo scrapeando los sitios de empleo con Claude Code, pasando por la JSON API de Datasette, Datasette Cloud y Datasette Agent; el resultado se publicó en este gist

La controversia por costos que se consume como historias de fracaso de IA tiene poca base

  • Han aumentado las historias de grandes empresas encendiendo alarmas por el aumento abrupto del costo de usar IA, pero los casos más citados parecen exagerados
  • Caso Uber

    • El caso más discutido es el reporte de The Information según el cual el CTO de Uber, Praveen Neppalli Naga, dijo que Uber “agotó en unos meses todo su presupuesto anual de IA para 2026”
    • Se presenta a Claude Code como una parte importante del aumento de costos
    • Como Claude Code realmente mejoró mucho en noviembre de 2025, no sorprende que el presupuesto fijado en 2025 no anticipara la demanda de 2026
    • También alimentó la controversia un comentario del COO de Uber, Andrew Macdonald, en el pódcast Rapid Response, pero el fragmento en cuestión es limitado
    • Andrew Macdonald dijo que 25% de los commits de código del trimestre anterior se hicieron mediante Claude Code, pero que es difícil vincular ese aumento de productividad con si realmente revivió proyectos cancelados o permitió crear 25% más funciones útiles para los consumidores
    • Ese comentario derivó en titulares como “AI tokenmaxxing: spending is getting harder to justify” de Business Insider
  • Caso Microsoft

    • Otro caso popular es la historia de que Microsoft empezó a cancelar licencias de Claude Code
    • En apariencia, fue una medida para impulsar a los ingenieros a usar directamente su propio agente Copilot CLI
    • Tom Warren, de The Verge, citó fuentes según las cuales la decisión también tuvo motivos financieros, y estaría ligada al cierre del año fiscal de Microsoft el 30 de junio
    • Ambos casos pueden interpretarse no como fracasos de la IA, sino como señales de precio aceptable: el producto pesa en el presupuesto del cliente, pero aun así termina siendo elegido
    • Eso encaja con la idea de que un buen precio es aquel ante el cual el cliente hace una breve pausa, respira hondo y aun así dice “sí”
    • El sobrecosto presupuestal de Uber y la cancelación de asientos en Microsoft parecen mostrar ese efecto en la práctica

El tamaño del gasto de los laboratorios de IA también es enorme

  • Los grandes laboratorios de IA están gastando miles de millones de dólares tanto en entrenamiento como en inferencia
  • Hay pocas cifras exactas y confiables, pero el reciente SpaceX S-1 contiene una pista importante relacionada con Anthropic
  • SpaceX informó que en mayo de 2026 firmó Cloud Services Agreements con Anthropic PBC para proporcionar acceso a capacidad de cómputo en COLOSSUS y COLOSSUS II
    • Anthropic acordó pagar a SpaceX $1.25 mil millones mensuales hasta mayo de 2029
  • El anuncio de Anthropic dice que este acuerdo permitirá “aumentar los límites de uso de Claude Code y la API de Claude”
    • Eso sugiere con fuerza que Colossus se usaría para inferencia, no para entrenamiento de modelos
  • Anthropic ya asegura enormes volúmenes de capacidad de cómputo de otros proveedores
    • El hecho de querer gastar $1.25 mil millones al mes en capacidad adicional de un solo proveedor muestra cuánto ha crecido su presupuesto de inferencia

Disminuye la importancia relativa de los ingresos por API

  • En los últimos 2 años, OpenAI parecía tener una mayor proporción de ingresos por suscripción, mientras que Anthropic parecía depender más de ingresos por API
  • Históricamente, los ingresos por API de Anthropic dependían en gran medida de unos pocos clientes grandes de API
    • Según un reporte de VentureBeat de agosto de 2025, dos clientes, Cursor y GitHub Copilot, representaban $1.2 mil millones de los entonces $4 mil millones en ingresos
  • Ahora hay rumores de que Anthropic alcanzará ingresos de $10.9 mil millones en el segundo trimestre y podría registrar utilidad operativa por primera vez
  • El giro hacia enterprise sugiere que los laboratorios concluyeron que hay más dinero en reducir intermediarios y vender directamente al cliente
  • Claude Code de Anthropic compite directamente con Cursor y Copilot

Abril de 2026 es un nuevo punto de inflexión

  • Noviembre de 2025 puede verse como el November inflection point, cuando GPT-5.1 y Opus 4.5, combinados con sus respectivos harnesses de agentes de codificación, se volvieron realmente utilizables
  • En los 6 meses posteriores, las empresas se han ido adaptando a sistemas de agentes capaces de realizar tareas útiles de forma consistente
  • Abril de 2026 parece ser un nuevo punto de inflexión en el que empezó a hacerse visible de verdad el impacto en ingresos de ese cambio tecnológico
    • En una dirección rentable para los laboratorios frontier de IA
    • En una dirección con impacto real sobre los presupuestos de las grandes empresas
  • Cuando se publiquen en el futuro los documentos S-1 para las IPO de Anthropic y OpenAI, será posible confirmar con cifras auditadas qué fue realmente este momento

1 comentarios

 
GN⁺ 4 시간 전
Opiniones de Hacker News
  • En los próximos 5 años tendrían que recuperar 5 a 10 billones de dólares y, si no lo logran, empezarán a depreciar la expansión de hardware
    Eso significa que haría falta más de 1 billón de dólares al año en gasto de tokens. Tomando como base a 200 millones de trabajadores del conocimiento en todo el mundo y 30 millones de desarrolladores, sería un mundo en el que el 5% del salario de todos los trabajadores del conocimiento, y en el caso de los desarrolladores el 20%, tendría que irse a tokens
    A mi alrededor dicen que con estas herramientas la velocidad en tareas que de verdad le importan a la empresa sube entre 20% y 40%. Si se aumenta el gasto 20% para mejorar la velocidad 20%, es difícil justificar un gasto anual de 1 billón de dólares
    Todavía no hemos llegado a ese punto. Ahora mismo estamos en la fase ascendente del ciclo de hype, y si no logran que los desarrolladores sean 2x, 5x o 10x más productivos en trabajo importante, no parece que esto vaya a terminar bien

    • Tengo algunas ideas. Viendo solo la información pública, la relación entre el costo de inferencia y el costo de entrenamiento parece entrar en conflicto
      Los ingenieros eléctricos involucrados en centros de datos hablan de los picos de consumo durante las corridas de entrenamiento como si fueran un factor clave del diseño, pero los papers sobre escalado óptimo de costos tratan con mucha seguridad la cantidad de cómputo en inferencia como un factor importante
      Un argumento a favor de que el entrenamiento sigue siendo mucho más intensivo en cómputo que la inferencia, incluso después de amortizarlo, es que proveedores chinos con fuertes restricciones de acceso a recursos de cómputo ofrecen tokens casi ilimitados a precios más bajos, pero con peor rendimiento de modelo. Tiene sentido si se interpreta que las empresas de EE. UU. están inflando entre 20 y 30 veces el costo de inferencia por los costos amortizados de entrenamiento que los proveedores extranjeros no pudieron absorber
      Si el costo de entrenamiento es mucho mayor que el de inferencia, entonces están en un dilema del prisionero mucho peor que el modelo competitivo típico de costo marginal cero. En cambio, si el costo de inferencia es mayor, podría ser correcto el análisis de que esto es un negocio parecido a un servicio público, como dicen algunos pensadores. Los CEO tienen un incentivo muy fuerte para decir eso. Si sale a la luz la alternativa del dilema del prisionero, la inversión podría frenarse muy rápido
      Lo único que quizá toque un poco la realidad son los rumores de los ingenieros de infraestructura; lo demás se parece más a análisis de alto nivel y administración de escritorio sobre un negocio secreto. Eso muestra el nivel actual de comprensión
      Si ni siquiera se conoce la proporción entre gasto de capital amortizado y costos operativos, el análisis de inversionistas externos es imposible. Da igual qué tanto se detalle la contabilidad de macetas de oficina y plantas de interior si la parte más grande del negocio está oculta como secreto comercial
    • Trabajo en una empresa muy pequeña, con ingresos anuales de 150 millones de dólares y un margen neto de 9%, y ya estamos considerando gastar 100 mil dólares en hardware para correr un modelo local, porque para nosotros ya es suficientemente bueno
      La proyección de gasto en servicios de IA superaría ese costo en menos de un año
      Parece probable que en unos años hasta empresas muy pequeñas puedan conseguir hardware a precios accesibles para correr modelos de frontera suficientemente buenos para la mayoría de las tareas
    • Cada quien observa cosas distintas, pero mi observación no difiere tanto. Solo que esa es una perspectiva de abajo hacia arriba. A estas alturas, ¿no deberíamos también verlo de arriba hacia abajo?
      Si ya pasamos la etapa de potencial y entramos en mejoras significativas de productividad, ¿por qué no aparece en las métricas del lado del cliente?
      ¿Por qué Delta Airlines no ha mejorado mucho su eficiencia operativa en los últimos 3 meses gracias a adoptar mejor software?
      De verdad me da curiosidad. Se siente una desconexión
    • Recuerdo con claridad algo que dijo mi profesor de econometría cuando estaba en la universidad, a finales de los 90 e inicios de los 2000
      Cuando aparecieron la TV por cable y el Pay Per View, hubo estudios sobre cuánto vería la gente películas si tuviera acceso ilimitado, y esos resultados circularon como si fueran evidencia de que había que instalar toda la infraestructura para sostener ese negocio. Pero cuando los estadísticos analizaron mejor los datos, concluyeron que la gente decía que vería películas todos los días, 7 días a la semana, 10 a 12 horas al día. Eran cifras imposibles
      Ahora siento algo parecido. Algunos asumen que todo el mundo va a usar el máximo posible de tokens y que, incluso con mejoras de hardware, software, diseño y presión de mercado, el precio de los tokens nunca va a bajar
    • Un factor a considerar es que la población base no va a seguir siendo la misma durante los próximos 5 años
      Cada generación de herramientas para desarrolladores ha aumentado el rendimiento absoluto de código y, al mismo tiempo, ha creado nuevas capas de desarrolladores y usuarios
      Siempre ha sido así, desde los primeros compiladores hasta la era de los frameworks y ahora; el nivel de habilidad necesario para ser desarrollador ha ido bajando. A mediados y finales de los 80 se necesitaba alguien con maestría o doctorado en ciencias de la computación para escribir aplicaciones, luego eso bajó a estudiantes de licenciatura e ingenieros de TI, la teoría de ciencias de la computación pasó a ser en gran medida opcional, después bajó a graduados universitarios con algo de capacitación, y antes de 2022 siguió bajando con herramientas no-code/low-code como retool, y ahora baja todavía más con servicios de generación de código por agentes como v0/Replit
      La próxima generación de desarrolladores no va a construir aplicaciones y arquitectura como la generación anterior. La mayoría aquí tampoco construye con el nivel de calidad con el que pg hizo esta plataforma, pero si los usuarios encuentran valor, no importa. La enorme cantidad de aplicaciones empresariales de calidad intermedia ya lo demuestra
      Al final, la lógica de estos negocios es que los números de 200 millones/30 millones no se van a quedar iguales. Yo tampoco creo que ese cambio vaya a ser lo bastante grande y rápido como para justificar el gasto de capital. Pero tampoco es completamente irreal: Web 1, Web 2.0, SaaS y la revolución móvil también crearon nuevas capas de usuarios y desarrolladores con bastante rapidez
      [1] HN es un caso atípico muy marcado por ser una implementación personalizada de Lisp, pero en épocas anteriores había muchos ejemplos usados con arquitecturas más sobrias pero sólidas, y ese nivel de pericia quizá sea difícil de encontrar en la generación actual de fundadores
  • Este análisis es confuso. En el lado de la programación, el product-market fit (PMF) probablemente ya se alcanzó el año pasado. La rentabilidad es otro tema y todavía no se sabe
    El texto mezcla ambas cosas, pero no presenta un argumento económico sólido ni cifras convincentes. Tampoco veo por qué el caso de Uber es relevante. Incluso el COO de Uber dijo claramente que, al menos desde la perspectiva del retorno sobre la inversión, no se ven resultados
    En mi opinión, el producto ya era muy útil para programar desde hace unos meses. Pero de ninguna manera es útil a cualquier costo

    • Lo confuso es que la gente parece estar ignorando la trayectoria. Quizá sea la parte más importante, pero queda enterrada
      Como dijo Simon, apenas han pasado 6 meses desde que aparecieron agentes de programación “suficientemente buenos”, y eso es un abrir y cerrar de ojos. Sin embargo, en nuestra empresa mi trabajo cambió por completo y casi parece un sueño
      Y eso es solo un punto de inflexión. Ya hubo varios y vienen más por delante. Puedo aceptar que hoy, incluso con un gasto empresarial absurdo, el retorno sobre la inversión quizá no sea positivo; pero allanar el camino ahora para lo que viene en unos meses, o mejor aún en unos años, es completamente razonable
    • El PMF es un concepto curiosamente definido como “si no estás seguro de que existe, entonces no existe”
      Para quienes se tomaron el tiempo de usarlo y entenderlo, ya era claramente útil desde hace meses; pero ahora ese conocimiento se ha extendido hasta quienes controlan la billetera y los ha convencido de que no es solo una moda o hype, así que ahora parece posible “afirmar” que hay PMF
      Aun así, estoy de acuerdo en que es raro decir “esa gente tiene PMF”. Normalmente es un concepto que se define sobre tu propio producto
    • Sí. El costo también es parte de la economía
      Por eso, a muchos aquí les convendría no meterse en la discusión. No hacen más que repetir las ventajas y no identifican ni explican los costos ni cómo esos costos afectan la situación financiera de una empresa
    • El texto le carga demasiado peso a la palabra “bueno”, y eso me hace desconfiar del análisis
      “Llamamos a noviembre de 2025 el punto de inflexión de noviembre porque GPT-5.1 y Opus 4.5, combinados con sus respectivos harness de agente de programación, mejoraron. Se volvieron lo bastante buenos como para realizar trabajo útil de forma confiable, y por eso nos hemos estado adaptando a sistemas de agentes durante los últimos 6 meses”
    • No se supone que sea un texto lógico. Se parece más a un blog de evangelización de LLM, y casi no hay análisis crítico que no sea favorable a la industria
      Incluso si lees otros textos, casi no hay escepticismo; hay mucho más contenido promocionando lo increíble que es
  • Este texto tiene un aire como de psicosis por IA
    “Estas herramientas queman muchísimos más tokens, pero se están convirtiendo rápidamente en herramientas cotidianas para el trabajo que realizan profesionales muy bien pagados”
    “De algún modo, este fragmento terminó convertido en un titular tipo ‘el COO de Uber dijo que cada vez es más difícil justificar el gasto excesivo en tokens de IA’, porque el mercado para historias de fracaso de la IA sigue siendo enorme”
    Claro, todo se reduce al deseo de ver fracasar a la IA. No puede ser que haya costos desbocados, ingresos récord y despidos masivos. Tampoco puede ser posible que gente ya muy bien pagada esté quemando dinero con estas herramientas sin generar ningún aumento de “valor”. Admito que la producción es 100 veces mayor, pero los resultados siguen planos en todas las métricas
    [1] https://cmr.berkeley.edu/2025/10/seven-myths-about-ai-and-pr...
    [2] https://futuretech.mit.edu/publication/crashing-waves-vs-ris...

    • ¿Qué significa exactamente eso de psicosis?
  • Si GLM-5.1 es igual de bueno, open source y mucho más barato, ¿cómo piensan OpenAI y Anthropic retener a sus clientes?
    No parece que el modelo de negocio vaya a funcionar. Un amigo muy cercano trabaja de verdad en software de automatización para grandes empresas y no usa ni Claude ni OpenAI
    Principalmente usa gpt 120b y GLM-5.1 sobre Cerebras para tareas de razonamiento pesado, y otros modelos más pequeños para varias tareas. Todo es open source
    Estos sistemas son muy útiles para las empresas y pueden ejecutar pipelines totalmente automáticos, muy estables y rápidos
    Hablamos seguido de este tema, y ambos creemos que las empresas que hacen trabajo pesado con agentes usando Claude y OpenAI no parecen saber exactamente cuánto ha mejorado y abaratado el open source en el último año
    Entonces, si las empresas y los desarrolladores actuales se ponen al día, ¿no podrían Claude y OpenAI dejar de recuperar sus costos?

    • GLM-5.1 no está al mismo nivel. No compite con Opus de Claude Code. Solo hay que probarlo. Los modelos open source están al menos como 1 año atrás
    • Estoy de acuerdo en que no se ve el modelo de negocio. Desde la perspectiva de las 5 fuerzas de Porter, es una pesadilla
      Va a haber una cantidad enorme de empresas compitiendo en este espacio y, aunque habrá cierto foso por lo intensivo en capital, aun así en la práctica habrá competidores casi infinitos
      Eso es bueno para los consumidores
    • Para programación siempre hay que usar el mejor modelo disponible en ese campo, no el que habría sido el mejor hace 1 año. GLM 5.1 está justo en esa posición
      Lo digo como gran fan de usar GLM en sitios de traducción porque su relación precio-rendimiento es suficiente
      En este momento la mayor parte del dinero está en programación. Si OpenAI y Anthropic solo van 6 meses por delante de los modelos open source de punta, pueden quedarse con la mayor parte del mercado empresarial y de desarrolladores
    • He probado varios modelos open grandes en OpenCode a través de OpenRouter para ayuda con programación, y todos me parecieron bastante malos comparados con Claude Opus
      ¿Podrías dar alguna pista sobre cómo usarlos para sacarles más valor?
      Estoy de acuerdo con esa idea común de que los modelos open van como 1 año atrás. Pero hace aproximadamente 1 año pasó esa especie de magia donde los modelos de punta se volvieron extremadamente útiles. Siguiendo esa lógica, los modelos open también deberían funcionar bien pronto, pero me preocupa que haya algo más que simplemente esperar a que la Tierra dé otra vuelta
      Para referencia, mi caso de uso es ayuda para programación. Para otros fines los modelos open podrían ser excelentes
    • ¿No hay que gastar entre 5 mil y 10 mil dólares para correr estos modelos que supuestamente son “tan buenos como los modelos de frontera”?
      Nunca he visto un análisis convincente sobre el retorno de inversión de correr tú mismo un modelo para programación, especialmente comparado con un plan de 20 o 200 dólares al mes
  • La frase “tokens por valor de 2,180.16 dólares por 200 dólares” suena rara
    Los tokens no tienen un costo ni un valor intrínseco. Decir que usaste tokens por valor de 2,180.16 dólares se parece a creerle a un vendedor que intenta convencerte de que un juego de ollas de 19.99 dólares vale mil millones
    Da risa ver cómo tiran por la ventana el pensamiento crítico al evaluar una fuente sesgada

    • No me queda claro a qué estás respondiendo aquí
      Yo gasté 200 dólares. Si hubiera pagado precio de API, habrían sido 2,180.16 dólares. El texto trata de que los clientes empresariales pagan precio de API, y significa que si yo hubiera estado contratado por una empresa así, le habría generado un costo de 2,180.16 dólares a la empresa
      ¿Qué me estoy perdiendo?
    • Los tokens sí tienen un costo intrínseco calculable. Está el costo marginal de producción, es decir, el costo de inferencia, y también el costo amortizado de I+D del modelo que produce esos tokens
      Calcular el valor es difícil, pero por suerte el mecanismo de precios del mercado existe precisamente para eso. No hay mejor cifra que el precio que la gente está dispuesta a pagar
      Así que sí, en un plan empresarial eso termina costando 2,180.16 dólares. Uno mismo no paga eso, pero la empresa sí
    • Según un cálculo aproximado basado en mi proyecto, pagar por token en OpenRouter a veces es competitivo o incluso más barato que correr el mismo modelo de pesos abiertos en una GPU alquilada
      El precio por token tanto de los modelos cerrados de frontera como de los modelos de pesos abiertos está en rangos parecidos, del orden de centavos a dólares por millón de tokens. Para mí, eso indica que esos precios tienen cierto anclaje en la realidad
    • Con pensarlo un poquito críticamente, esa frase se lee como “tokens por valor de 2,180 dólares según los precios actuales de API”
    • Claro que hay un costo intrínseco. El piso es la factura de electricidad. Da mucha risa ver cómo abandonan el pensamiento crítico al evaluar una fuente sesgada
  • El verdadero timing está en que ahora falta una demanda fuerte de negocios nuevos y ya se acumuló suficiente capital tecnológico como para que el trabajo se esté volviendo cada vez más incremental
    Eso significa que se pueden construir funciones estables sobre una enorme base de trabajo previo, y ahí es donde la IA brilla especialmente. Así que, hubiera IA o no, si la mayor parte del trabajo consistiera en tareas incrementales como agregar una función, corregir un bug o ajustar un poco una configuración, las empresas habrían contratado menos ingenieros de software. La IA solo aceleró esa presión
    En cambio, si imaginas la misma IA hace 20 años, sería distinto. Cuando la gente todavía estaba tratando de entender JAX-RS, ¿de verdad la IA habría podido usar Jersey? Cuando React acababa de inventarse, ¿habría podido responder todas las preguntas sobre React? ¿Habría podido reducir a una décima parte la gente necesaria para construir toda la infraestructura de nube pública o las llamadas plataformas de big data? En ese tiempo todo evolucionaba rápido, así que se necesitaban muchos ingenieros para explorar una enorme cantidad de posibilidades. También dudo mucho que la IA hubiera podido construir el ecosistema de machine learning con una décima parte del personal. Hace 20 años R era lo dominante y el ecosistema de Python no estaba nada maduro. Lo mismo con la computación móvil: ¿habría reducido la IA a una décima parte a la gente que construía todas las apps móviles y la infraestructura subyacente?

    • Sobre “¿habría podido la IA responder todas las preguntas sobre React?”, creo que sí por el aprendizaje en contexto (ICL)
      Sobre “¿habría podido construir infraestructura de nube pública o plataformas de big data con una décima parte del personal?”, creo que no. No resuelve los problemas clave y, cuando escala, hace un desastre
      En cuanto al trabajo incremental, sí. Pero históricamente la mayor parte del trabajo siempre fue incremental, y los puestos de I+D eran minoría
  • Hay que reconocer lo que es. Todo esto es la mayor estafa de la historia.
    La IA sí tiene casos de uso útiles, pero no a estos precios. He usado IA desde la época de GPT-2 junto con bastantes usuarios intensivos. Todos cuentan la misma historia: curiosidad, sorpresa, hype, rechazo, entendimiento. Las empresas suelen llegar un poco tarde y ahora mismo estamos en el ciclo de hype. Justo en ese punto es cuando vendes todos los contratos y haces el IPO.
    Una jugada totalmente de manual de VC.
    Lo que no hay que malinterpretar es que sí existen casos útiles para la IA. Simplemente no de la manera en que ellos quieren. Se parece bastante a blockchain. La idea de una moneda descentralizada merece existir. El otro 99% de las monedas, no.
    La IA es un motor de búsqueda más rápido, pero todavía menos preciso. Es excelente para encontrar bugs y también sirve para hacer rubber duck debugging.
    Lo llamo una estafa porque, junto con el marketing, les da a muchísimas personas en todo el mundo la impresión de que ahora ya pueden crear startups, juegos, infraestructura y demás sin aprender por sí mismas. El resultado son millones de proyectos y productos abandonados y de baja calidad. La mayoría nunca construyó los modelos mentales necesarios para resolver un problema a fondo. Al final desperdician meses y dinero, y solo queman tokens. A eso le llamo estafa.
    Todos los early adopters que conozco redujeron muchísimo su uso no por el dinero, sino porque ya no hay nuevos casos de uso. Cuando exploras un proyecto nuevo, puedes hacer onboarding rápido y aprender bastante, y luego pasar a la documentación y a las pruebas reales. Mi uso está en su punto más bajo de los últimos 2 años.
    No voy a dejar que la IA toque mi código. Me da ansiedad que vuelva a colarse. En cambio, sí dejo que lea mi código y me diga qué hice mal para seguir puliéndome.
    Cientos de empresas pueden ofrecer eso, incluidas soluciones open source.
    Todos mis amigos no técnicos están ahora mismo en el ciclo de hype y me comparten la emoción que viene, junto con la frustración predecible.
    En cierto sentido, impresiona que la IA, de forma consciente o inconsciente, haya sido aprovechada de una manera tan profundamente VC como para crear enormes empresas mientras todo el mundo mira.

    • ¿Me ayudas a ordenar tu argumento original?
      ¿Quieres decir que es una estafa porque el retorno sobre la inversión de los modelos de programación que usan tokens no es positivo? Por ejemplo, ¿que no generan suficiente valor como para justificar cobrar 100 dólares al mes?
      ¿Quieres decir que los clientes empresariales no son lo bastante inteligentes como para darse cuenta de eso?
      ¿En última instancia es una ilusión estilo blockchain, pero se hace IPO para maximizar las ganancias del CEO?
      ¿Lo entendí bien o te puse palabras en la boca?
      La parte de “les da a las personas la impresión de que ahora pueden crear su propia startup, juego o infraestructura sin aprender por sí mismas” suena un poco a hombre de paja, ¿no? No se puede asumir tanto sobre las creencias y motivaciones de la gente. La IA es una herramienta poderosa que amplifica a las personas. No puedes simplemente escribir un prompt como “créame una app Enterprise SaaS valuada en mil millones de dólares” o “hazme GTA6 y no alucines”. Pero, ¿de verdad existe la impresión de que eso está pasando? ¿Dario y Sam están diciendo “compra nuestra suscripción al agente de coding y podrás hacer un juego de una sola vez sin conocimientos técnicos y volverte rico”?
      Es totalmente válido no sentir valor en los agentes de IA hoy. También puede darte mala espina sin razón clara. Pero decir que es una estafa al nivel de blockchain me parece contradecir señales enormes, además de la conversación real sobre lo que estos sistemas pueden hacer hoy y lo que se espera que hagan hacia fin de año.
  • Por lo que he leído, Anthropic en realidad no es rentable y parece que solo se vio momentáneamente en negro por los descuentos. Este artículo sostiene bien ese argumento: https://www.wheresyoured.at/anthropics-profitability-swindle...
    También soy escéptico de que las subidas de precio actuales sean suficientes, y de que la mayoría de usuarios y empresas vayan a aceptar los aumentos de precio todavía mayores que harán falta en el futuro. Sobre todo porque 200 dólares al mes para un usuario individual ya es carísimo, y no parece probable que la mayoría vaya a pagar algo como 1,000 dólares al mes.

  • Creo que simplemente hay que ignorar las noticias sobre LLM hasta después de que estas empresas hagan IPO. Hay muchos bots fabricando opinión positiva.

  • 200 dólares al mes por asiento no es nada.
    Un solo paquete de licencias de 3D CAD que usa la gente de nuestro grupo de I+D cuesta miles de dólares al mes por asiento.
    Ya es hora de que también quieran a los asientos de software.

    • AutoCAD cuesta 175 dólares al mes por usuario [1]
      [1] https://www.autodesk.com/products/autocad/buy
    • Sí, no es nada, pero tampoco es lo que realmente pagan las empresas. Como dice el artículo, el precio es 20 dólares al mes por asiento más el cobro por uso de API por token.
      Las empresas no están pagando un “bufet ilimitado” de tarifa fija, sino facturación por uso.
    • Incluso la licencia de CATIA más cara que he visto cuesta alrededor de 600 dólares al mes por usuario. ¿De dónde sacaste lo de “miles de dólares” por asiento?
    • Si ahora además sumas los salarios de los ingenieros, te das cuenta de que el asiento de software ya es más caro que ese asiento de I+D.
    • ¿Se supone que CAD se va a convertir en una herramienta que use toda la gente que trabaja?