6 puntos por GN⁺ 4 시간 전 | 2 comentarios | Compartir por WhatsApp
  • La infraestructura de IA generativa necesita generar más de 2 billones de dólares en ingresos anuales por cómputo de IA para 2030 si quiere justificar la inversión en centros de datos y los compromisos de cómputo
  • Los 190 GW de centros de datos planificados equivalen a entre 9.5 y 15 billones de dólares, aplicando un costo de 80 mil a 100 mil millones de dólares por GW, y para hacerlo realidad haría falta emitir entre 500 mil millones y 1 billón de dólares anuales en deuda para centros de datos
  • Se espera que OpenAI consuma al menos 852 mil millones de dólares para finales de 2030, y Anthropic tendría que alcanzar una meta de 174 mil millones de dólares de ingresos anuales en 2029 para poder sostener sus compromisos de cómputo
  • Tras el cambio a la facturación basada en tokens, las empresas están teniendo dificultades para ver claramente su gasto en IA y medir el ROI, y Uber, T-Mobile y Brex han fijado límites de gasto en tokens por empleado
  • Actualmente, el 89% de los ingresos de las startups de IA se concentra en OpenAI y Anthropic, por lo que haría falta al menos 250 mil millones de dólares adicionales al año en demanda de cómputo de IA para justificar la escala de cómputo que se está construyendo

La IA no puede darse el lujo de desacelerarse — necesita más de 3 billones de dólares en ingresos para finales de 2030

  • Si se aplican tal cual los datos de Sightline Climate, la capacidad planificada de centros de datos es de 190 GW, y si se aplica la afirmación de Jensen Huang de 80 mil a 100 mil millones de dólares por GW, el costo se calcula entre 9.5 y 15 billones de dólares
  • La idea de Bloomberg de una construcción de centros de datos de 3 billones de dólares no cuadra con ese cálculo, y el capital necesario tendrá que salir de algún lado
  • Un reporte del Financial Times planteó que los bancos podrían no ser capaces de absorber la deuda de centros de datos, y la emisión actual, de unos 250 mil millones de dólares al año, tendría que subir a entre 500 mil millones y 1 billón anual para que la construcción realmente ocurra
  • NVIDIA espera alcanzar 1 billón de dólares en ingresos para finales de 2027, y como el 54% de sus ingresos proviene de tres clientes, sus ingresos futuros dependen de unos pocos clientes y de la capacidad de sus contrapartes para financiarse con deuda
  • La venta de 85 mil millones de dólares en acciones de Google y el plan de Meta de vender acciones por varios miles de millones se relacionan con un entorno en el que a los hyperscalers les resulta cada vez más difícil financiarse con deuda

Los compromisos de cómputo de OpenAI y Anthropic

  • Los compromisos de cómputo y chips de Anthropic suman 330 mil millones de dólares entre Google, Amazon y Microsoft, 30 mil millones con CoreWeave y 15 mil millones con SpaceX
  • Anthropic tendría que alcanzar una meta de 174 mil millones de dólares de ingresos anuales en 2029 para poder cubrir ese costo de cómputo
  • Anthropic levantó 95 mil millones de dólares en rondas de febrero, abril y mayo, pero ni ese dinero ni su flujo de caja bastan para cubrir los costos, así que necesitaría captar al menos 200 mil millones adicionales el año siguiente
  • Se espera que OpenAI consuma al menos 852 mil millones de dólares para finales de 2030 y ha adquirido compromisos de cómputo por más de 770 mil millones de dólares entre Microsoft, Amazon, CoreWeave, Cerebras y Oracle
  • La captación de 122 mil millones de dólares por parte de OpenAI en marzo no alcanza para cubrir sus costos, y necesita al menos 250 mil millones adicionales antes de fin de año

Cálculo de ingresos de centros de datos y el riesgo para Oracle

  • La IA generativa y el cómputo de IA tienen que generar más de 2 billones de dólares anuales en ingresos para 2030; de lo contrario, no cierran ni el gasto de capital en centros de datos ni el pago de los compromisos de Anthropic y OpenAI
  • Si se aplica un PUE de 1.35 a los 190 GW de centros de datos, la carga central de TI queda en unos 140 GW, y con una tarifa de 12.5 millones de dólares por MW se necesitarían 1.75 billones de dólares en ingresos anuales
  • Incluso si solo se construyera la mitad de la capacidad planificada, harían falta 875 mil millones de dólares al año para que los centros de datos no se queden sin financiamiento
  • OpenAI y Anthropic proyectan ingresos de 184 mil millones y 174 mil millones de dólares en 2029, respectivamente, para un total combinado de apenas 358 mil millones
  • Si OpenAI no puede o no quiere sostener el cómputo de Oracle, Oracle podría quedarse sin fondos; Oracle está gastando entre 340 mil y 700 mil millones de dólares en 7.1 GW de centros de datos para OpenAI

El gasto actual en IA no es suficiente

  • El plan de Salesforce de gastar 300 millones de dólares en Anthropic en 2026 está muy por debajo de la escala necesaria
  • La suma de la demanda actual de cómputo de todas las empresas de IA del mundo no llega a 100 mil millones de dólares, y para 2030 se necesitaría 10 veces más
  • Según The Information, la concentración de ingresos de startups de IA en OpenAI y Anthropic llega al 89%
  • La tasa anualizada de 37 mil millones de dólares de IA de Microsoft se compone principalmente de cómputo para OpenAI, y el CEO de Microsoft AI, Mustafa Suleyman, afirma que los modelos de Anthropic son demasiado caros y quiere reducir a cero el uso de Microsoft
  • Aunque Anthropic y OpenAI gasten 500 mil millones de dólares al año en cómputo, todavía harían falta más de 250 mil millones anuales adicionales en ingresos por cómputo para justificar la construcción de centros de datos

Facturación por tokens e incertidumbre sobre el ROI

  • No se puede medir el costo ni el retorno de inversión de tareas específicas de IA, y las empresas han ampliado la adopción de IA sin medir los resultados
  • Anthropic y OpenAI pasaron a sus clientes a facturación basada en tokens en el primer trimestre de 2026, y en solo dos o tres meses la incertidumbre sobre costos de IA y ROI se convirtió en un tema recurrente en los principales medios de negocios
  • En una encuesta de KPMG citada por el Wall Street Journal, la visibilidad de costos de IA se dividió en 26% completa, 50% parcial y 22% nula o solo visible después del cobro
  • Una empresa gastó 500 millones de dólares en modelos de Anthropic en un solo mes por no poner controles de gasto, y Uber agotó en un solo trimestre su presupuesto anual de tokens
  • Uber limita el gasto de IA a 1,500 dólares mensuales por usuario, T-Mobile temporalmente a 2,000 dólares mensuales por usuario, y Brex a 500 dólares semanales para ingenieros y 5 dólares semanales para no ingenieros

Agentes de código, loops y problemas de resultados

  • Boris Cherny, responsable de Claude Code, y Peter Steinberger, evangelista de OpenClaw propiedad de OpenAI, les piden a los usuarios diseñar loops para agentes
  • Los loops son una forma de hacer que un LLM siga actuando durante el tiempo que se quiera, incluso sin que el usuario agregue más prompts
  • En las suscripciones subsidiadas, el costo de los errores del modelo queda oculto tras pagos mensuales de 20, 100 o 200 dólares, pero cuando el usuario paga el costo real, el costo del fracaso se vuelve evidente
  • Esto se relaciona con estudios que muestran que mientras más razona un LLM, más alucinaciones produce, y el enfoque de agentes deja que el LLM haga su propio plan
  • Notion bloqueó el acceso a Anthropic durante varias horas tras una interrupción del servicio de Anthropic, y muchas de las apps creadas por herramientas de codificación con IA no pasan de ser slopware inútil e inseguro

La metáfora de la araña metálica gigante

  • La araña metálica gigante es un dispositivo de 1 millón de dólares, y cada uso requiere 40 mil dólares de combustible, pero puede recoger cosas o preparar la cena
  • El mismo dispositivo puede sacar una Diet Coke del refrigerador con precisión o hacerle un agujero al refrigerador, y el usuario tiene que pagar 40 mil dólares sin importar el resultado
  • Gracias a los subsidios, los usuarios comunes solo viven de vez en cuando los actos destructivos, pero las empresas cargan con el costo real y el fabricante pierde miles de millones de dólares al año en entrenamiento y mantenimiento
  • Las nuevas funciones amplían lo que supuestamente puede hacer, pero cada función adicional cuesta cientos de millones de dólares, y a veces ni siquiera está claro si realmente aprendió algo nuevo
  • Aunque exista un estudio que muestra una mejora en la capacidad de completar al 50% tareas de cierta longitud, la araña de la metáfora sigue siendo impredecible y también hace cosas que el usuario no pidió

La economía circular de la IA y la demanda real de producto

  • La IA generativa tiene altos costos de operación, los principales laboratorios de IA no tienen una ruta hacia la rentabilidad, y tampoco se puede medir el costo ni el ROI de tareas basadas en LLM
  • Los proyectos de IA pueden aumentar los costos operativos entre 10% y 100%, y contrario a la promesa de que bajarían los costos tanto para operadores como para clientes de servicios de IA, los costos han venido subiendo
  • Los altos costos sostienen una estructura en la que los laboratorios de IA envían dinero a sus socios hyperscaler de cómputo, y ese dinero vuelve a circular hacia los laboratorios y hacia la demanda de GPUs de NVIDIA
  • Si OpenAI o Anthropic buscaran rentabilidad o sostenibilidad, la demanda de cómputo de IA bajaría, y también bajaría la demanda de Azure, Google Cloud, Amazon Web Services, CoreWeave, Oracle Cloud Infrastructure y GPUs de NVIDIA
  • Para que se cumplan los compromisos y proyecciones actuales, toda la pila de IA tendría que multiplicarse por 10, y harían falta 250 mil millones de dólares adicionales al año en demanda de cómputo de IA y al menos dos empresas más del tamaño de OpenAI o Anthropic

2 comentarios

 
mammal 1 시간 전

La API nunca dejó de cobrar por tokens...

 
GN⁺ 4 시간 전
Opiniones de Hacker News
  • Hoy Apple presentó funciones de IA renovadas y, según varios reportes, Apple estaría operándolas pagando a Google solo alrededor de 1.000 millones de dólares al año
    En la práctica, eso equivale más o menos a licenciar propiedad intelectual, y parece que a Google le resulta aceptable ceder por esa cantidad el derecho a operar y destilar sus propios modelos
    Aunque los ingresos de consumo sean solo una parte del rompecabezas completo, cuesta ver por qué un usuario de Mac o iPhone que quede satisfecho con la nueva IA de Apple tendría necesidad de pagar por ChatGPT
    Google también va a poner herramientas parecidas en los teléfonos y seguirá ofreciendo funciones de IA en búsqueda, así que no veo dónde está la evidencia de que, una vez exista la tecnología de Apple, la IA de consumo valga para Anthropic u OpenAI mucho más que 1.000 millones de dólares al año
    Incluso si OpenAI firma un acuerdo para entrar en teléfonos Samsung y Samsung estuviera 10 veces más desesperada que Apple, eso sería algo así como 10.000 millones de dólares al año; si la proyección de ingresos de consumo de OpenAI para 2026 es de 14.000 a 15.000 millones de dólares, aun si la alcanzan, parece difícil sostenerla cuando los usuarios de iPhone ya tengan funciones integradas útiles
    Ed Zitron se parece más a un agitador británico escandaloso, pero en general parece estar diciendo cosas acertadas

    • Probablemente sea por una razón parecida a por qué la app de Gemini viene preinstalada por defecto en teléfonos Android de todo el mundo y aun así está muy por detrás de ChatGPT en uso y adopción entre consumidores
      Aunque ahora hasta hay un botón de Copilot en Windows, la gente usa GPT; Microsoft Edge no es el navegador más popular en Windows, e Instagram Threads tampoco le hizo un gran daño a TikTok
      La pregunta está planteada al revés. La gente tiene una fuerte preferencia por usar lo que le gusta y seguir usándolo
      No hace falta un foso enorme; el problema aparece cuando los usuarios siguen insatisfechos con el producto o cuando existe un competidor claramente mejor del que todo el mundo habla
      Si las funciones de Apple no ofrecen una ventaja significativa frente a simplemente usar GPT, sería difícil esperar un milagro
    • Estoy usando Kagi Assistant para tareas de IA, pero en otoño Siri podría reemplazarlo
      La pregunta que queda es si seguiría usando Kagi por el buscador, o si el nuevo Siri me llevaría en general hasta donde necesito. Debería prestar más atención a con qué frecuencia realmente veo resultados de búsqueda y cuándo solo miro el resumen de IA
      También hay partes que no vi en la presentación de Apple. Por ejemplo, para programación básica mencionaron el LLM de Xcode, la app Shortcuts y Safari Extensions, pero justo hice que me creara una página web para mostrar datos obtenidos con Kagi, y Gemini también pudo hacerlo
      No sé si Siri podrá hacerlo; todavía está por verse, y la experiencia también importa. ChatGPT maneja mucho mejor el proceso de escribir código con una interfaz de programación que tiene editor en vivo, mientras que Kagi se siente como ChatGPT de hace unos años: escupe bloques completos de código y cada vez que corriges algo te suelta otro volcado entero de código
      Irse a Xcode puede ser demasiado, y Siri podría quedarse corto, así que puede seguir existiendo un vacío en el uso prosumer de IA que Apple no logre cubrir
    • No estoy de acuerdo con la afirmación de que, aunque OpenAI alcance entre 14.000 y 15.000 millones de dólares en ingresos de consumo en 2026, ese vaya a ser su último año; estaría dispuesto a apostar con la misma convicción por el lado contrario
      Anthropic no parece prestar demasiada atención a la IA de consumo, y es posible que el segmento de consumidores sea el cliente menos rentable
      Apple parece más cerca de aumentar el uso de IA entre consumidores generales, y se parece a cuando Instagram añadió Stories. Frenó el crecimiento de Snapchat, pero sería prudente no dar por hecho que también le va a quitar muchos usuarios a OpenAI
      Si ahora mismo pagas por ChatGPT, probablemente lo uses para programar como hobby, proyectos o generación de imágenes, y los usuarios que más pagan casi seguro lo usan para proyectos personales de programación
      Los suscriptores de más de 100 dólares al mes no se irán por esto, y también me cuesta muchísimo ver una salida significativa incluso entre los usuarios de 20 dólares al mes
    • La vía más evidente para que los laboratorios de IA consigan clientes es la GPU en la nube
      La mayoría de los usuarios del mundo usa teléfonos baratos con CPU débiles y poca RAM, así que no pueden ejecutar localmente modelos realmente útiles
      No está claro si, en el acuerdo Google-Apple, Google también está vendiendo por esos 1.000 millones de dólares acceso a cómputo en la nube, o si solo comparte pesos y propiedad intelectual
      Apple también dijo que habrá límites de uso y upgrades de suscripción para usar más, así que en la práctica se abre un frente de competencia directa con los laboratorios de IA. Incluso con un valor predeterminado, puede haber competidores exitosos, como Safari y Chrome, así que esta competencia también es posible
      También es muy probable que Google ofrezca sus modelos con descuento respecto de su valor real para quitarle a un competidor principal lleno de efectivo el incentivo económico de entrar en la carrera armamentista de entrenamiento de modelos base
      Los usuarios que quieran funciones serias más allá de resumir o pulir el estilo pueden encontrar valor, aunque sea de forma ocasional, en una suscripción razonable o en un plan con publicidad para modelos de mayor calidad
      Apple también podría ofrecer eso, pero cuando la gente empiece a comparar funciones, para muchos Gemini, Claude o ChatGPT podrían encajar mejor
      También existe el riesgo real de que Apple, una vez más, prometa demasiado y que la calidad del modelo lanzado sea baja, empujando aún más a los usuarios hacia servicios por suscripción
    • Los usuarios de ChatGPT ya han metido una enorme cantidad de datos sobre su vida e intereses
      Eso incluye vida personal, intereses, planes, negocios e incluso información familiar, así que cambiarse a otra app de IA implicaría volver a empezar desde cero, lo cual resulta bastante doloroso
  • Una de las señales que delatan a un agitador charlatán es cuando adopta un tono exaltado de “¿por qué nadie entiende esto?”, pero en realidad su lógica no conecta.
    Si el argumento de Zitron fuera tan sólido como él dice, quien lo lea debería poder entenderlo y ver que es sólido.
    Si empezara con las estadísticas de demanda de IA y luego siguiera con cuidado el cálculo hacia el siguiente paso, como los ingresos necesarios para la rentabilidad de las empresas de IA, se podría seguir su razonamiento, pero él salta, da brincos y vuelve atrás.
    Si la situación de verdad fuera tan clara como para decir “¿cómo es que no lo ven?”, la explicación también debería ser clara, y no lo es. No es clara porque la situación misma no es tan clara.

    • Siempre me ha parecido un poco extraño que la gente se enfoque demasiado en el estilo de Ed más que en su mensaje.
      Su mensaje, en términos generales, es que la industria tecnológica está profundamente corrompida en lo moral. Es difícil decirlo sin sonar alterado, pero no se lee como una exageración sin fundamento, sino más bien como incredulidad del tipo “¿por qué siguen invirtiendo y trabajando en Meta pese a la evidencia abrumadora de que es una empresa que hace cosas terribles a la gente?”.
    • ¿No es justamente eso lo que hace la primera sección con título, eso de partir de las estadísticas y continuar el cálculo hasta los ingresos necesarios?
    • No leo a Ed Zitron fuera de cuando aparece en Hacker News, y puedo estar de acuerdo en que su tono es excesivo.
      Aun así, según entendí, su idea es que las empresas de IA prometieron comprar X cantidad de cómputo, se están construyendo centros de datos para cubrir esa demanda, esos centros de datos tienen que recibir Y cantidad, pero las empresas de IA no tienen ingresos suficientes para pagar Y.
      En lo personal, no me sorprende. Los usos reales de IA que he visto son generación de código o llamadas automáticas de ventas y estafas, y no me parecen un mercado lo bastante grande como para sostener las enormes cantidades de dinero que están circulando ahora.
      Me da curiosidad por qué se considera que Ed está tan equivocado. A mí me parece que se acerca una gran corrección en la IA en general.
    • Me da curiosidad cuál de los hipervínculos ofrecidos al principio te pareció que contenía lo que buscabas, y cómo terminó decepcionándote después de hacer clic.
      Ese tipo de información no es algo que uno esperaría que se repitiera y copiara en cada entrada periódica del blog.
      Suena sarcástico, pero si de verdad hiciste clic, sinceramente me interesa la respuesta.
    • Expresiones como “los periodistas están obsesionados ahora mismo con OpenAI y Anthropic” definitivamente generan rechazo.
      Es un intento pobre de imitar el periodismo moderno de denuncia; quiere ser ingenioso, pero tiene poca sustancia.
  • Ya se ha dicho muchas veces, pero Ed Zitron es una persona difícil de considerar confiable.
    A mi parecer, ha sido sesgado y se ha equivocado muchas veces incluso en cosas muy obvias y menores, así que cuesta aceptar sin más un análisis complejo que incluye cifras y tendencias.
    Por ejemplo, recuerdo un tuit de hace unos meses en el que se burlaba de la gente que hablaba de agentes y de programación agentiva. Era algo como “¿Agentes? ¿Qué agentes? ¿Saben siquiera de qué están hablando?”, y en las respuestas hubo cientos de personas explicando que sí usaban agentes de verdad.
    Tiene una audiencia y objetivos de participación, y su propósito no es informar, sino conseguir clics.

    • Es interesante que sus cifras se basen en fuentes que él mismo dijo que no confiaba.
      La dirección general puede ser correcta. Por ejemplo, podría tener razón en que los ingresos necesarios para justificar ese gasto se ven absurdamente altos, pero parece mezclar cifras para construir un peor escenario posible que no necesariamente coincide con la realidad.
      Si a eso se suma que no muestra una actitud abierta ante nada que tenga aunque sea una mínima relación con la IA, cuesta tomarlo en serio.
      A las publicaciones les encantan las peroratas catastrofistas y deprimentes, y por eso parece que construyó su carrera con textos anti-IA histéricos. Eso no significa que tenga razón.
    • Este texto incluye bastante análisis cuantitativo, así que dar uno o dos ejemplos de por qué estas cifras están mal haría más fuerte el argumento.
      La parte más convincente del texto es que, solo viendo los números, la magnitud de la inversión necesaria parece insostenible en términos de dólares puros.
      Incluso si no estás de acuerdo con el autor, se puede seguir el razonamiento. OpenAI, SpaceX y Anthropic tendrían que salir a bolsa este año para evitar quedarse sin dinero, y ya no hay suficiente capital privado disponible. La IPO es la última ronda de financiamiento.
      La IA puede ser muy útil y transformadora, y las empresas pueden crecer rápido, pero puede que no exista el dinero para sostener ese crecimiento.
      La parte sobre una empresa de IA quebrada que canceló un contrato con Oracle hizo que Oracle me recordara a una analogía tipo Nortel. Si de pronto se cae un gran bloque de clientes, podrían tener que hacer amortizaciones de cientos de miles de millones de dólares.
    • Él llama estafadores a todos, pero él también lo parece.
      Soy profundamente escéptico respecto a los señores de la IA, pero seguir insistiendo en que no hay absolutamente nada ahí no es honesto.
  • Zitron ya está en un punto en el que casi ruega por un colapso
    Es cierto que ha señalado grandes riesgos financieros desde un análisis macro, pero por su pesimismo constante está pasando completamente por alto la utilidad sobre el terreno que mucha gente en HN siente a diario: enormes mejoras de productividad
    Por ahora prefiero creer que existe una zona intermedia en la que esta expansión de la capacidad individual conduce a grandes descubrimientos

    • Si quitas las acciones relacionadas con IA de cualquier índice bursátil, ¿qué ves? Nada
      Entonces no sé a dónde se está yendo toda esa productividad, dónde está el valor, ni dónde están las estadísticas de desempleo masivo o los millones de nuevas startups ganando muchísimo dinero
    • Al menos para mí, él ha mostrado de forma constante que no entiende bien cómo funciona técnicamente la inferencia, y eso debilita su tesis central de que tiene que venir un colapso
      En un ciclo de hype recalentado hace falta una crítica equilibrada, así que la voz contraria en sí tiene valor, pero sus argumentos no son sólidos incluso si aceptas sus premisas
      Mi mayor problema con sus cálculos aproximados es que trata el margen bruto de la inferencia como si fuera algo nuevo que no se puede comparar con los márgenes normales de SaaS
      En parte es cierto. El entrenamiento de modelos, la construcción de infraestructura relacionada y el carrusel interminable de I+D y costos periféricos para mantener la competitividad sí cambian un poco el análisis
      Pero decir que esto es estructuralmente distinto de los márgenes normales de SaaS es exagerar. El modelo de negocio no se parece a Dropbox, pero sí bastante al AWS inicial, a los CDN y a las telecos
      Lo digo porque telecomunicaciones es un campo en el que pasé más de la mitad de mi carrera como ingeniero y fundador: también pueden existir negocios de infraestructura extremadamente intensivos en capital cuya rentabilidad depende de la utilización, la sobreventa, la planificación de capacidad pico, la segmentación y la recuperación del gasto de capital
      Con la aparición de una segmentación de tareas explícita para reducir costos, sus cálculos se vuelven todavía más dudosos. Las organizaciones más adelantadas ya están entendiendo que no hace falta usar el mejor y más caro modelo para cada tarea
      Las tareas fáciles se pueden enrutar a modelos baratos, se puede usar caché, los trabajos no urgentes se pueden procesar por lotes, y los modelos de frontera pueden reservarse solo para algunas tareas que de verdad requieren inteligencia de frontera. Eso choca de frente con la afirmación de que los proveedores siempre tienen que perseguir inteligencia de frontera para sostener la demanda actual, la utilización y la curva de precios
    • Productividad no es valor
      Puedes sentir mejoras de productividad y aun así no estar creando valor real, y creo que eso es justamente lo que muestran los datos más sólidos
      https://unessays.substack.com/p/talk-is-cheap
    • Si eso es tan innegable, me pregunto por qué no hay absolutamente ninguna evidencia científica
      ¿Hay algún estudio revisado por pares a gran escala o algún metaanálisis que confirme esa afirmación?
    • Desde 2024 él viene prediciendo una y otra vez que el colapso es inminente, que el progreso se está desacelerando y que no existe un mercado de inferencia
      El simple hecho de que nunca haya reflexionado sobre los fracasos evidentes de su propio análisis ya dice lo necesario sobre su honestidad intelectual
      Hay verdad en parte de lo que dice sobre los riesgos financieros, pero si no puede reconocer también el potencial alcista, tampoco puede evaluar bien el riesgo
      Por eso me cuesta tomarlo en serio
  • En este hilo hay muchos comentarios que lo descartan de entrada, pero pocos abordan el contenido sustancial del texto
    La cuestión clave es si es cierto que “la IA no puede darse el lujo de desacelerarse: necesita más de 3 billones de dólares en ingresos para fines de 2030 solo para sostener su existencia”
    Si la masa salarial total en 2024 fue de 11.7 billones de dólares [0], y el empleo no agrícola ese mismo año fue de 158,000 [1], entonces mi cálculo aproximado de que la IA tendría que absorber o crear al menos 1 de cada 20 empleos para llegar al punto de equilibrio se queda corto por un orden de magnitud
    [0] https://fred.stlouisfed.org/series/BA06RC1A027NBEA
    [1] https://fred.stlouisfed.org/series/PAYEMS

    • Si crees que existe un pequeño grupo secreto que realmente maneja la economía mundial, suena casi a ficción
      En 2008 y en 2020~2023 entró una cantidad enorme de dinero a la economía, y los ricos se hicieron absurdamente más ricos. Esa riqueza ahora está atada a la versión de los años 2020 del ferrocarril/la fibra óptica, y en la práctica estamos intentando borrar billones de dólares de la economía mundial para hacer un reinicio
      Sí hace falta un reinicio
  • Antes de gastar 20 minutos leyendo esto, hay que saber que este autor lleva más de dos años publicando opiniones populares pero consistentemente equivocadas del tipo “la IA está fracasando, es un desperdicio de dinero, es mala y nunca va a funcionar”
    Por ejemplo, textos como este de marzo de 2024: https://www.wheresyoured.at/peakai/

    • No sé dónde lo escuché, pero me recuerda la historia de alguien que predijo temprano el colapso puntocom, por ahí de 1998
      Durante dos años parecía claramente un loco y se perdió una gran subida del mercado, pero al final tuvo razón. Claro, después las tecnológicas se recuperaron lentamente
      Predecir el momento de estas cosas es famosamente difícil, y haberse equivocado con el timing hace dos años no significa que no vaya a haber una corrección
    • ¿Podrías señalar alguna parte concreta de ese texto que llamarías consistentemente equivocada? No es que esté en desacuerdo, pero al hojearlo no vi nada que saltara de inmediato
    • La calidad del pesimismo sobre IA está a la par de la calidad del optimismo sobre IA
      Ed es algo interesante como termómetro, pero me cuesta tomar en serio lo que escribe
    • Recomiendo mucho leer el perfil de Wired: https://www.wired.com/story/ai-pr-ed-zitron-profile/
      Tim Lee también señaló que había cosas bastante raras cuando Ed publicó algunos detalles de su análisis: https://x.com/binarybits/status/2034377838883700953
    • En este momento el contenido anti-IA puede dar algo de consuelo y por eso parece fácil hacer clic, pero él sigue equivocándose y normalmente insiste en la línea de “estos negocios ni siquiera generan ganancias”
      En cuanto aparece el popup para suscribirse al newsletter, cierro la pestaña
  • Ed es un personaje interesante
    Su análisis financiero de la industria de la IA tiene sentido en términos lógicos, pero no tengo suficiente conocimiento como para saber si de verdad es correcto
    Dicho eso, parece estar tan enojado con la IA en general que pasa por alto áreas evidentes donde los LLM sí están cambiando realmente el estado del arte
    La programación parece ser uno de los principales casos de uso de los LLM, como señaló recientemente Simon Willison, y aunque ese fuera el único caso de uso real, sería tremendamente útil
    Utilidad y rentabilidad no son lo mismo, y ahí creo que Ed sí toca un punto importante. Estas empresas no podrán generar ganancias hasta que la inferencia sea mucho más barata, y aunque algunos jugadores gigantescos pagarán el precio de los tokens de API, la mayoría no lo hará

    • No creo que si los LLM realmente cambian el estado del arte tenga relación con lo que él escribió
      Si las empresas de IA necesitan decenas de miles de millones de dólares en ingresos para mantenerse a flote, es 100% irrelevante si el 0.5%, el 5% o el 50% de esos ingresos viene de cambiar el estado del arte
      Lo importante no es si hay transformación, sino que estas empresas no van a tener ingresos para pagar las cuentas, y si ellas no pueden pagarlas, muchas otras compañías tampoco podrán
      Así que, haya transformación o no, sigue siendo un castillo de naipes esperando venirse abajo. Para cambiar eso no hace falta más “transformación”, sino un paquete de capacidades que pueda multiplicar varias veces la base actual de usuarios o subir varias veces los precios
    • Puede que haya encontrado una audiencia suscriptora, y que esa actitud conecte bien con sus suscriptores
      En cierto sentido resulta bastante refrescante. Mucha gente critica tal o cual aspecto de la IA, pero al final añade una cláusula de descargo tipo “igual en realidad me encanta la IA y la uso todos los días”
      Probablemente intenta evitar que constructores pragmáticos lleguen en masa a los comentarios a repartir matices con calma; en términos actuales, que lo invadan guerreros furiosos del teclado con un resentimiento a cuestas, y cansa tener que abrirse paso entre ese falso equilibrio
      A Zitron es difícil hacerle esa crítica. Diga lo que diga, no parece temer que lo vean como alguien que toma partido
    • Parece que cierta clase de personas no puede separar estas tres cosas: 1) no les gusta la IA como tecnología, 2) no les gustan las personas y empresas que ganan dinero con la IA, 3) creen que la IA no sirve
      Las tres son posturas completamente distintas. Puedes pensar que la IA es muy útil y aun así no gustarte porque podría reducir tu estatus social, o te puede gustar la tecnología pero pensar que Sam Altman es deshonesto
      Pero muchos comentaristas anti-IA, de forma extraña, sienten que tienen que presentar las tres afirmaciones a la vez
      Lo más gracioso es que, si de verdad fuera inútil, no habría necesidad de preocuparse. El mercado terminaría descubriendo esa inutilidad, todo volvería a la normalidad y la gente que la odia perdería dinero
      Claro, no creo que en verdad crean que es inútil. Más bien creo que les preocupa qué efecto tendrá sobre su prestigio, y desean con todas sus fuerzas que algún día todos “despierten” y compartan la creencia de que los LLM no son más que loros estocásticos sin utilidad. Pero la gente los usa todos los días y está viendo en tiempo real cómo mejoran
    • Es muy probable que el costo de inferencia baje bastante
      Su argumento es que, para que estas empresas sean rentables, tendrían que ocurrir cosas enormemente grandes y sin precedentes antes de 2022. En general estoy de acuerdo, pero yo creo que esas cosas ya llevan años ocurriendo, así que seguirán ocurriendo
    • Se repite mucho que la inferencia es cara, pero en la mayoría de los casos viene de la ignorancia
      No hay absolutamente ninguna base para creer que la inferencia es cara más allá del ambiente general. Si miras los datos y la intuición, los márgenes son altos
      Esta forma de pensar refuerza mi creencia de que la gente, sin saber realmente, usa la frase “la IA no es rentable y es demasiado cara” como una especie de catarsis frente a un avance enorme
  • Zitron es alguien cuyo negocio no es acertar predicciones, sino producir contenido
    No importa cuántas veces él y gente como él digan que el final ya llegó; basta con que acierten una sola vez
    Dicho eso, por ahora sí tiene razón en algo respecto a la economía. Todavía no existe una forma de recuperar esta inversión gigantesca

    • Si el objetivo es producir contenido, ni siquiera hace falta acertar una sola vez
  • En mi opinión, la IA va a cambiar el mundo de forma radical.
    Puede empeorarlo, mejorarlo o mezclar ambas cosas, pero no lo pongo en duda.
    El salto de los LLM apenas comenzó hace 5 o 6 años. Como referencia, las ondas de radio se descubrieron en 1886, Marconi las usó para comunicación en 1895, y aunque el teléfono y la radio coexistieron durante décadas, los celulares y la tecnología inalámbrica despegaron de verdad hasta 1995.
    La razón de que tomara tanto tiempo no fue que la física de las ondas de radio necesitara madurar, sino que todo lo demás necesario para ganar dinero con eso necesitó tiempo.
    Para mí, los LLM son menos IA y más bien bloques de construcción. Podrían equivaler a las ondas de radio o al transistor.
    Ya estamos viendo que es posible conectar LLM para convertirlos en agentes. Hoy, el precio es el principal factor que limita con dureza la programación y a los agentes.
    Si solo quieres Claude Code o Codex, más o menos está bien, pero hay muchas combinaciones de LLM que la mayoría de la gente ni se atreve a probar. Por ejemplo, impulsar con LLM las conversaciones de NPC y las mecánicas del mundo en un juego todavía no es viable por costo.
    Si el precio del hardware de inferencia baja y los algoritmos de inferencia siguen mejorando, estoy convencido —y al mismo tiempo me da miedo— de que veremos cosas que hoy son difíciles de imaginar.

    • De hecho, estoy trabajando justo en ese problema.
      El costo no es el problema. Las respuestas y los escenarios coherentes en contexto son limitados en número, así que no hace falta que un LLM genere texto en tiempo real dentro del juego.
      En cambio, puedes usar un LLM para crear un corpus enorme de “átomos” como mensajes de diálogo, fragmentos y pistas, y luego unirlos de forma determinista según la entrada del jugador. También se puede revisar de antemano y someter a muchas pruebas antes de implementarlo.
      Para un jugador que interactúa dentro del juego, un sistema así sería funcionalmente difícil de distinguir del texto generado, siempre que esté dentro del rango de interacciones para el que fue diseñado.
      También tiene grandes ventajas. Si el jugador rompe el rol y empieza a picar a propósito, podrían notarse las costuras, pero no se prestaría al abuso como un LLM.
    • Decir que “la IA puede cambiar el mundo para bien, para mal, o para ambas cosas” es una afirmación vacía.
      Sospechar que algo puede hacerlo mejor, peor o ambas cosas, vaya agudeza.
      También es rara la frase de “todavía estamos demasiado temprano”. Ya hubo varios anuncios en el Super Bowl, las empresas que prácticamente dominan las noticias de tecnología lograron que los periodistas repitan sin cuestionar las tonterías de sus CEO, y aunque digan que valen más de 1 billón de dólares, da la impresión de que quienes tienen autoridad para refutar sus finanzas solo asienten.
      Construyeron centros de datos de cientos de acres, firmaron contratos de centros de datos que no se concretarán y exigen miles de millones de dólares al mes.
      Están devorando el silicio y la gente está viendo con sus propios ojos cómo los precios del hardware se duplican, triplican o más.
      Los trabajos obligaron a sus empleados a usar IA y luego dieron marcha atrás cuando se acabaron los subsidios y los costos quedaron expuestos, y dejó de ser divertido.
      Y aun así dicen que hace falta más tiempo, más atención, que más gente lo vea. No sé en qué parte de la historia de la radio pasó algo así.
    • Me interesan mucho más el diálogo y los personajes creados por escritores que las conversaciones de NPC impulsadas por LLM.
      La simulación es aburrida.
  • La base de Ed para pensar que “la IA se está desacelerando” es el tope de gasto de las empresas, en particular el límite de Uber de 1,500 dólares mensuales por herramienta por ingeniero.
    Yo interpreto la misma evidencia exactamente al revés. Hace apenas un año, la idea de que una empresa gastara 1,500 dólares al mes por empleado en herramientas de IA habría parecido absurda, y uno se preguntaría qué demonios harían con IA para gastar tanto.
    Pero ahora que aparecieron los agentes de programación y agentes cada vez más generales, la demanda de los empleados subió tanto que las empresas tuvieron que imponer límites.
    El mercado total potencial de estas empresas de IA subió a 1,500 dólares mensuales por trabajador del conocimiento, así que no entiendo cómo eso sería una desaceleración.

    • Tal vez eso sea posible en algunos estados donde el Big Tech de EE. UU. les paga salarios ridículos a los ingenieros.
      Pero para que cuadren los retornos de inversión, habría que gastar esa cantidad o más a nivel global, y a largo plazo no hay forma de que esos presupuestos se aprueben.
      A las empresas les encanta recortar costos, y en cuanto decidan que existe otra forma de obtener el mismo valor o uno mejor, igual que recortan personal a voluntad, ese presupuesto también desaparecerá rápido.
      O simplemente podría desaparecer por la exigencia de valor de corto plazo de los accionistas.
    • En realidad ni siquiera son 1,500 dólares al mes por ingeniero, sino 1,500 dólares al mes por herramienta por ingeniero.
      O sea, con solo usar Claude Code y Cursor ya te vas fácilmente a 3,000 dólares al mes, y si además Codex entra como opción, podrían ser 4,500 dólares.
      Y como escribiste en el blog, es un soft cap que puedes rebasar si lo justificas.