xAI se está pareciendo más a un negocio de renta de centros de datos (REIT) que a un laboratorio frontier
(martinalderson.com)- En las últimas semanas, ha firmado consecutivamente contratos para alquilar gran capacidad de GPU a Anthropic y Google, transformándose en algo más parecido a un operador de renta de infraestructura que a una desarrolladora de modelos
- En febrero, xAI se fusionó con SpaceX, creando una estructura en la que los ingresos por alquiler entran directamente a la entidad que eventualmente podría salir a bolsa
- Para Anthropic, la escala sería de $1.25bn al mes / 300MW (aprox. 220 mil GPU), y para Google de $920mn al mes / 110 mil GPU; si se mantienen por 18 meses, podrían recuperar por completo unos $40bn en costos de construcción
- La escasez extrema de oferta de GPU y la rápida capacidad de SpaceX/xAI para construir centros de datos actúan como la verdadera ventaja competitiva detrás de estos contratos
- A medida que la capacidad destinada a su propio modelo Grok se arrienda directamente a competidores, se entrelazan la posibilidad de un retroceso en la carrera de laboratorios frontier y el éxito o fracaso de la mayor IPO en la historia de Norteamérica
Estructura de los contratos y contexto de la fusión con SpaceX
- xAI firmó recientemente alianzas para suministrar gran capacidad de GPU a Anthropic y Google
- En febrero, xAI se fusionó con SpaceX, por lo que los ingresos de estos contratos entran directamente a la entidad que se prepara para cotizar en bolsa
- Se habla de una posible ingeniería financiera (
financial engineering) de cara a la IPO de SpaceX, pero hay aspectos que van más allá de una simple maniobra contable
El problema de falta de capacidad en Anthropic
- En los productos de Claude, especialmente en las primeras horas de la tarde en Europa y la mañana en EE. UU., se produjo una grave falta de capacidad
- Es la franja en la que usuarios de Europa y América trabajan al mismo tiempo y compiten con más intensidad por la capacidad
- Anthropic introdujo límites en horas pico dentro de su suscripción
- El uso entre las 5 a. m. y 11 a. m. PT / 1 p. m. y 7 p. m. GMT consume una mayor parte del cupo de uso
- El objetivo es aplanar la demanda entre horas pico y no pico
- Como la demanda está creciendo rápidamente, mover la demanda de horario ya no basta, y más restricciones de uso parecen inevitables
- Es una situación poco deseable mientras Google y OpenAI presionan por captar clientes
Contratos de suministro de capacidad de xAI
- A inicios de mayo, xAI anunció que daría a Anthropic acceso al antiguo centro de datos Colossus 1 en Memphis
- Gracias a ello, Anthropic retiró sus límites de uso para suscriptores; la estabilidad del servicio sigue siendo insuficiente, pero la escasez en horas pico se alivió temporalmente
- El contrato con Anthropic creció hasta 300MW de capacidad por $1.25bn al mes, equivalente a unas 220 mil GPU
- La semana pasada, Google también anunció una alianza similar: 110 mil GPU por $920mn al mes
- Ambos contratos incluyen cláusulas de cancelación
- Después de un periodo inicial de lock-in, cualquiera de las partes puede cancelar con 90 días de aviso previo
Análisis de rentabilidad
- A simple vista, parecen contratos de altísima rentabilidad para xAI
- Si duran 18 meses, podrían recuperar por completo unos $40bn de capex de construcción, y aún conservar cientos de MW de GPU
- Eso sí, no incluye opex ni depreciación
- A mediano plazo, es probable que la escasez de cómputo continúe, por lo que incluso las antiguas H100 seguirían siendo muy útiles dentro de 18 meses
-
Estimación del costo de energía (opex)
- A plena carga, 300MW consumirían unos 2.6 mil millones de kWh al año
- Comprando energía de la red con la tarifa industrial barata de Tennessee (aprox. 6 centavos/kWh), eso sería unos $160mn al año
- Colossus opera principalmente con turbinas de gas en sitio; usando una eficiencia térmica de ciclo simple de ~10,000 Btu/kWh y gas Henry Hub a ~$3.50/MMBtu, el costo anual de combustible sería de unos $90mn, aún más barato
- Comparado con los cerca de $15bn al año que Anthropic pagaría por 300MW, la electricidad apenas representa alrededor del 1% de los ingresos
Objeciones y señales de alerta (red flags)
- Elon Musk y OpenAI están en una disputa legal intensa, y existe la posibilidad de que el contrato con Anthropic busque presionar a OpenAI más que generar beneficio comercial real
- Google es un accionista importante de SpaceX, por lo que existe un incentivo para inflar la valuación de la IPO
- Aun así, lo importante es que las GPU están masivamente escasas
- Detrás del boom de capex en centros de datos está el hecho de que todos los operadores van muy retrasados respecto a sus cronogramas
- Incluso el principal centro de datos Stargate UAE de OpenAI está directamente amenazado por el actual conflicto con Irán; drones iraníes ya impactaron otro centro de datos en Emiratos Árabes Unidos
La ventaja competitiva de construcción de SpaceX/xAI
- SpaceX/xAI sobresale por su capacidad para construir centros de datos dentro de plazos definidos
- El primer Colossus 1 se construyó en solo 122 días
- El ecosistema de Musk tiene una gran fortaleza para planear, construir y ejecutar rápidamente proyectos de infraestructura a gran escala
- Los hyperscalers también tienen experiencia, pero han construido en entornos con menos urgencia, y los proyectos normales suelen tardar años en ejecutarse
- El capex solo se aceleró de verdad en los últimos años, así que muchos proyectos siguen programados para terminar varios años más adelante
- Este es un punto que no puede descartarse a la ligera y constituye una ventaja competitiva importante para xAI
La posición de Grok
- Gran parte de la capacidad de centro de datos prevista para el entrenamiento e inferencia de Grok se está alquilando directamente a competidores, dejando a Grok en una posición ambigua
- Hay señales de un retroceso claro en la carrera entre laboratorios frontier
- Aunque también es posible que hayan sobreestimado la capacidad de centro de datos necesaria, o que la demanda de inferencia de los modelos Grok haya quedado muy por debajo de lo esperado y hayan optado por monetizar el excedente
- El contrato entre xAI y Cursor complica aún más la situación
- La ingeniería financiera, la enorme escasez de cómputo y la ventaja competitiva en construcción de centros de datos son en cierta medida ciertas las tres
- El peso de cada factor determinará el éxito o fracaso de la mayor IPO en la historia de Norteamérica
- En conjunto, xAI no parece tanto un laboratorio frontier con un negocio de centros de datos adherido, sino más bien un REIT de centros de datos con un laboratorio frontier adherido
1 comentarios
Opiniones en Hacker News
Google posee 5~6% de participación en SpaceX. Si SpaceX apunta a una valoración de 1.77 billones de dólares, la participación de Google valdría entre 88.5 y 106.2 mil millones de dólares
No soy escéptico respecto a la IA/LLM en sí, pero este tipo de operaciones circulares me parecen muy sospechosas y me preocupa qué pase cuando la música se detenga
No hay GPUs ociosas, y en los laboratorios de IA de frontera el cómputo se convierte directamente en dinero. Sí puede haber algunas operaciones circulares dudosas, pero no creo que este caso entre en esa categoría
No es un producto especulativo donde compras tokens para revenderlos; aquí los tokens se consumen en el momento de la inferencia
En realidad es difícil saber cuánto eleva esta operación la capitalización de mercado de SpaceX, y a menos que Google vaya a vender pronto su participación en SpaceX, tampoco tiene mucho sentido llamarlo operación circular
No sé si hacerlo con capital en vez de deuda busca quitarle algo de impulso al mercado de IPO de Anthropic y OpenAI, pero será interesante ver cómo recibe el mercado estas nuevas acciones. Alguien no va a alcanzar su meta de recaudación, y quien salga a IPO más tarde podría terminar cargando con el costo
¿No se decía hasta hace poco que la valoración de SpaceX se basaba en parte de las ganancias de Starlink y en una enorme especulación?
Pero ahora que se sabe que recibe 2.2 mil millones de dólares al mes, o 26 mil millones al año de nuevos ingresos, de Google y Anthropic, la conversación no gira hacia eso sino hacia cosas como “la tecnología de xAI no es gran cosa” o “la estructura Google/SpaceX es mala para la economía”
Esto es razonamiento motivado. Cuando entra información nueva, uno debería actualizar sus conclusiones previas, pero en cambio están buscando otra vía para reaccionar negativamente. La gente que odia a Elon/SpaceX está contaminando por completo la narrativa
Parece que xAI concluyó que esta es la mejor manera de extraer valor de sus activos. Y claramente Google y Anthropic también creen que pueden usar esos activos para generar más valor que el costo del alquiler que pagan a SpaceX
Así que, al mismo tiempo que invalida la lógica especulativa, también muestra que hay un problema en la parte tecnológica que era el núcleo de esa especulación
Si usas tanto Grok como los modelos competidores, es difícil refutar el punto básico de que Grok no es tan bueno como los modelos rivales. Eso puede importar o no desde la perspectiva del negocio
Pero en este caso el modelo de negocio transformado cambia de raíz la propuesta de valor. No veo por qué sería más deseable la narrativa de “una empresa espacial que gana dinero con el negocio espacial ahora juega a ser revendedora de cómputo y eso está bien”
Y tampoco me gusta mucho responder a cierta “narrativa” sin refutarla directamente, sino más bien atacándola de forma indirecta. Tampoco está claro quiénes somos “nosotros” aquí, y parece una forma de fingir que existe un consenso que en realidad no existe
Ya sabemos a cuánto están alquilando estas GPU. Ahora de verdad me da curiosidad el costo de insumo de generar la electricidad
¿De verdad le queda a xAI margen suficiente en estas operaciones como para cubrir la depreciación?
Revisé las notas y parece que Colossus opera en gran parte con turbinas de gas propias en sitio, y que con una eficiencia térmica de ciclo simple de unos 10,000 Btu/kWh y un precio del gas Henry Hub de $3.50/MMBtu, el costo de combustible sería de unos 90 millones de dólares al año
Eso es ridículamente barato. Yo también quiero saber cómo entrar al negocio de alquilar GPU a hyperscalers
Esto no es un REIT de centros de datos. Un REIT de centros de datos no vende cómputo, sino espacio, energía y enfriamiento para donde irá ese cómputo
Entiendo lo que quiere decir el autor. Que el activo más valioso de SpaceX sería la capacidad de cómputo, pero la analogía no es precisa
En este momento, SpaceX en realidad se parece más a una holding que contiene casi todo lo de Elon fuera de Tesla. Si apuestas por SpaceX, estás apostando por un conglomerado
Desarrollaron un LLM, así que sí son un laboratorio de IA, pero viendo la calidad del modelo, no diría que sea de primera línea
Cada uno tiene sus pros y contras, y personalmente ChatGPT me sigue pareciendo el mejor, luego Gemini/Claude y después Grok.
En uso general, Grok suele sentirse 1 o 2 generaciones por detrás de los modelos competidores, pero hay tres cosas que me gustan. Primero, parece ser el mejor en entender eventos recientes. No sé si es por la integración con X o por la optimización de llamadas a herramientas en el backend, pero cuando preguntas sobre algo que está ocurriendo ahora mismo, muchas veces los otros modelos tienen información desactualizada o responden peor.
Segundo, para temas personales por lo general es el menos adulador. Anthropic también va en esa dirección, y ChatGPT y Gemini están mejorando, pero los modelos anteriores casi nunca decían nada negativo sobre lo que yo hacía. Cuando necesito consejo profesional o personal, me gusta el tono de respuesta de Grok.
Tercero, en el trabajo hay temas que los otros modelos se niegan a tratar. En mi empresa anterior había muchísimos usuarios del área legal, y cuando había que resumir ciertos temas en transcripciones de testimonios, la mayoría de los modelos se negaban, pero Grok no. Entiendo la necesidad de la seguridad y no culpo a otros proveedores, pero hay trabajos profesionales donde realmente se necesita un modelo capaz de manejar temas sensibles.
En casos como “encuéntrame un repositorio de GitHub que estuviera haciendo $vague_thing en 2017”, Grok encuentra lo que quiero con más frecuencia.
No digo que haya sido intencional, pero en la práctica produjo ese efecto.
Para eso no hace falta un centro de datos para inferencia, sino un enorme centro de datos para entrenamiento.
Para quien no esté familiarizado, REIT significa real estate investment trust, o sea, un fideicomiso de inversión inmobiliaria.
¿Este texto es una versión en artículo de un comentario[1] del usuario de HN runako de hace dos días?
También es perfectamente posible que varias personas hayan tenido la misma idea al mismo tiempo, pero si es un post del propio autor, que no lo mencione se ve un poco descortés.
[1] https://news.ycombinator.com/threads?id=runako#48426082
La misma idea también apareció en los comentarios aquí hace dos días: https://news.ycombinator.com/item?id=48426082
Ahora mismo es muy difícil alcanzar a OpenAI y Anthropic. El círculo virtuoso de generar ingresos, usar esos ingresos para comprar más cómputo, y con más cómputo entrenar modelos más inteligentes ha hecho mucho más difícil competir.
Si ya no pueden competir en LLMs de vanguardia, entonces desde la perspectiva de SpaceXAI tiene más sentido dedicarse a proveer cómputo.
Elon destaca en hardware, pero en xAI hizo despidos masivos al estilo PayPal Mafia y, como en la adquisición de Twitter, poco después intentó volver a contratar, pero fracasó en reunir ingenieros de software a gran escala.
Los acuerdos de centros de datos llegaron después. Pero la persona que le prometió al mundo defender la libertad de expresión y sistemas de IA “pro-humanos” ahora se los está vendiendo a competidores y está reduciendo el límite diario de uso de la app de Grok por múltiplos de un solo dígito.
Si haces negocios con la persona más rica del mundo, puedes predecir que, pese a toda otra retórica, al final el dinero va a pesar más que cualquier otra consideración. Aun así, es una estrategia interesante.
Siendo justos, en una entrevista del año pasado dijeron que consideraban que el hardware era el “cuello de botella”. Pero sigo creyendo firmemente que subestimaron el problema del software. La app tenía muchos problemas, y todavía los tiene.
xAI es una empresa integrada verticalmente, y en la parte de cómputo lo ha hecho muy bien. Sus modelos de más alto nivel oscilan entre estar entre los mejores y quedar 1 o 2 generaciones por detrás de los de punta, y sobre el papel incluso hubo una vez en que estuvieron brevemente en la cima.
Si mañana vuelven a estar arriba, ya tienen el know-how para escalar. Si Google o Anthropic están de acuerdo, incluso podrían recomprar los recursos que prestaron.