Se desinfla la burbuja de las GPU H100: por qué el precio de las GPU cayó de $8 a $2

(latent.space)

8 puntos por GN⁺ 2024-10-12 | 2 comentarios | Compartir por WhatsApp

Tras el lanzamiento de ChatGPT en noviembre de 2023, la demanda de GPU H100 se disparó y la tarifa de renta por hora subió de $4.70 a más de $8
Los proveedores de centros de datos estimaban un periodo de recuperación de la inversión de menos de 2 años al rentar H100 a más de $4.50 por hora
Sin embargo, para agosto de 2024, la tarifa de renta de las GPU H100 en clústeres pequeños cayó al rango de $1 a $2

Criterios de rentabilidad de la inversión en H100 para centros de datos

Más de $2.85 por hora: posibilidad de superar el rendimiento del S&P500
Menos de $2.85 por hora: rendimiento inferior al del S&P500
Menos de $1.65 por hora: se esperan pérdidas de inversión a 5 años

Principales causas de la fuerte caída de precios en el mercado de GPU H100

El auge de los modelos de pesos abiertos impulsó la demanda de inferencia y fine-tuning
En cambio, el mercado de fabricantes de modelos fundacionales pequeños y medianos se contrajo
- Muchas empresas y startups se dieron cuenta de que ajustar finamente modelos abiertos existentes era más económico y efectivo que entrenar sus propios modelos
- Startups y empresas sin planes de entrenar modelos grandes de más de 70B retiraron sus inversiones
Muchos proveedores de infraestructura aseguran sus ganancias mediante contratos de largo plazo de 3 a 5 años
- Esto fue impuesto por varias empresas de modelos fundacionales durante el pico de la IA en 2023
- Comenzó la reventa de capacidad no utilizada de nodos reservados
La construcción de clústeres propios por parte de grandes creadores de modelos como Facebook y Microsoft redujo la demanda de clústeres existentes
ChatGPT se lanzó en noviembre de 2022 con la serie A100, y la H100 se introdujo en marzo de 2023. La H100 era 3 veces más potente que la A100, pero costaba solo el doble
Aparición de GPU alternativas a la H100, como AMD MI300 e Intel Gaudi3
La transición de Ethereum a proof-of-stake y el dominio de los ASIC en la minería de Bitcoin redujeron la demanda de minería con GPU

Implicaciones

El costo promedio de una H100 supera los $50k y, asumiendo una vida útil de 5 años, existen distintos modelos de renta
- Por encima de $2.85 por hora se puede superar la TIR del mercado bursátil, pero por debajo de ese nivel pueden generarse pérdidas
Es muy probable que nuevas inversiones en hardware H100 provoquen pérdidas
- Salvo situaciones excepcionales como H100 con descuento, tarifas eléctricas, o requerimientos especiales de clientes
En cambio, la caída del precio de las H100 será un catalizador para la expansión de la IA de pesos abiertos
- Se espera que impulse la experimentación con modelos abiertos y el desarrollo de aplicaciones por parte de desarrolladores e ingenieros
Featherless.AI ofrece inferencia instantánea de más de 2,000 modelos de IA open source por una tarifa fija mensual de $10
- Para asegurar la rentabilidad del hardware es indispensable optimizar todas las capas y elegir GPU personalizadas

Opinión de GN⁺

Cambios en el mercado de GPU: La caída del precio de las GPU H100 muestra lo rápido que está cambiando el mercado de GPU. Esto tiene un gran impacto para inversionistas y proveedores de infraestructura
Influencia de los modelos open source: La aparición de modelos open source como Llama 3 aumenta la demanda de fine-tuning e inferencia. Esto reduce la demanda de entrenamiento de modelos a gran escala
Ascenso de las GPU alternativas: A medida que las GPU de AMD e Intel surgen como alternativas a la H100, la competencia del mercado se intensifica. Esto podría añadir más presión a la baja sobre los precios de las GPU
Oportunidad para las aplicaciones de IA: La reducción en el costo de las GPU puede bajar la barrera de entrada para desarrollar aplicaciones de IA y fomentar más innovación
Necesidad de replantear la estrategia de inversión: La inversión en infraestructura de GPU requiere un enfoque cuidadoso y una observación estrecha de las tendencias del mercado

2 comentarios

readiz 2024-10-14

El efecto mariposa que desató llama... está interesante. Jaja

GN⁺ 2024-10-12

Opiniones de Hacker News

Un servicio que ofrece GPUs a $2 podría poner en riesgo su negocio al depender de cómputo poco confiable. AWS ha mejorado la confiabilidad de la infraestructura de GPUs empresariales de alto nivel.
- Es imposible ser rentable ofreciendo H100 a $2.
Los centros de datos que ya tenían infraestructura pudieron obtener grandes ganancias con las H100. Pero en un mercado eficiente, esas oportunidades no duran para siempre.
- A $2.00 sigue siendo rentable, pero se necesita electricidad/infraestructura/mano de obra baratas.
La verdadera ganancia está en alquilar clústeres InfiniBand, no GPUs o máquinas individuales.
- El clúster Lambda One Click indica $4.49/H100/hora.
En todo el mundo, hay menos de 50 equipos que necesitan 16 nodos H100. Muchos equipos no serán rentables.
- Incluso las empresas tradicionales de desarrollo de software tienen una baja tasa de éxito.
Muchos fundadores intentan entrenar modelos para convencer a los inversionistas, pero son pocos los casos en que realmente se ha entrenado un modelo valioso.
- Incluso a OpenAI le resulta difícil evitar la fuga de capital.
- Hay preocupación por la posibilidad de que aparezcan avances técnicos o competidores más baratos.
Se expresa tristeza por los laboratorios universitarios que no pudieron comprar recursos de cómputo durante la época en que la investigación en IA estaba en auge.
- Cuando llegue el invierno de la IA, el costo del cómputo volverá a ser barato.
Esta situación recuerda al ciclo de auge y caída del petróleo descrito en 'The Prize: The Epic Quest for Oil, Money & Power'.
OpenAI debe seguir mejorando sus modelos para responder al avance de los modelos de código abierto.
- Con el tiempo, la ventaja de OpenAI podría dejar de ser importante para la mayoría de la gente.
Esto suena como malas noticias para las granjas de alquiler de GPUs.
Se comparte la opinión de que se aumentó ligeramente la posición en corto sobre NVDA.
- Se considera que el pico está cerca.

Se desinfla la burbuja de las GPU H100: por qué el precio de las GPU cayó de $8 a $2

Criterios de rentabilidad de la inversión en H100 para centros de datos

Principales causas de la fuerte caída de precios en el mercado de GPU H100

Implicaciones

Opinión de GN⁺

Lecturas relacionadas

2 comentarios

Opiniones de Hacker News