1 puntos por GN⁺ 2 시간 전 | 1 comentarios | Compartir por WhatsApp
  • HBM subió de 52% en el 1er trimestre de 2024 a 63% en el 4º trimestre de 2025, según el promedio ponderado por volumen de producción de los chips de IA de Nvidia, AMD, Google y Amazon
  • En el mismo periodo, la proporción de los logic dies se mantuvo casi sin cambios en alrededor de 13%, mientras que el empaquetado avanzado bajó de 19% a 15% y los componentes auxiliares de 15% a 9%
  • El gasto en HBM de las cuatro empresas de diseño aumentó de unos 12 mil millones de dólares en 2024 a 32 mil millones de dólares en 2025, creciendo interanualmente más rápido que otros componentes
  • El gasto total en componentes de chips de IA aumentó de unos 22 mil millones de dólares a 52 mil millones de dólares, y solo HBM explicó alrededor de 20 mil millones de dólares del incremento
  • En 2026, la presión de costos podría aumentar aún más por la escasez de memoria y el alza de precios, y Microsoft y Meta también señalaron el aumento en los precios de componentes como un factor detrás del mayor gasto de capital

Cambios clave

  • La participación de la memoria de alto ancho de banda (HBM) en el gasto de componentes de chips de IA subió de 52% en el 1er trimestre de 2024 a 63% en el 4º trimestre de 2025
  • Esta estimación es un promedio ponderado por volumen de producción para todos los chips de IA diseñados por Nvidia, AMD, Google y Amazon
  • En el mismo periodo, los logic dies se mantuvieron casi sin cambios en alrededor de 13%, mientras que el empaquetado avanzado cayó de 19% a 15% y los componentes auxiliares de 15% a 9%
  • El gasto en HBM de las cuatro empresas de diseño aumentó de unos 12 mil millones de dólares en 2024 a 32 mil millones de dólares en 2025, con un crecimiento interanual más rápido que el de otros componentes
  • El gasto total en componentes de chips de IA pasó de unos 22 mil millones de dólares en 2024 a alrededor de 52 mil millones de dólares en 2025, y el gasto en HBM por sí solo representó cerca de 20 mil millones de dólares del aumento

Presión de costos en 2026

Método de cálculo y alcance de los datos

  • Para cada chip de IA diseñado por Nvidia, AMD, Google y Amazon, se estimó el costo por chip de memoria, logic die, empaquetado avanzado y componentes auxiliares
  • Al multiplicar el costo de componentes de cada chip por el volumen de producción trimestral estimado, se calculó el gasto total por categoría y se obtuvo su proporción frente al gasto total en componentes entre el 1er trimestre de 2024 y el 4º trimestre de 2025
  • Las estimaciones de costo de componentes provienen de AI Chip Components explorer y construyen una especificación de componentes por chip con base en reportes financieros, materiales de proveedores e informes de analistas
  • La metodología detallada puede consultarse en la documentación metodológica del explorer

Categorías de componentes

  • Memoria

    • Incluye stacks HBM, con HBM3 y HBM3e
  • Lógica

    • Incluye logic dies de procesos avanzados de 3 a 5 nm
  • Empaquetado

    • Incluye el empaquetado avanzado CoWoS de TSMC
  • Componentes auxiliares

    • Incluye sustratos, suministro de energía y otros insumos no lógicos ni de memoria

Tratamiento de la incertidumbre

  • Existen incertidumbres de costo en los costos unitarios de cada componente, como el precio de los stacks HBM, el de los logic dies y el de los paquetes CoWoS
  • El costo por componente de cada chip se modeló con un intervalo de confianza del 90%
  • La participación de cada componente es el costo de ese componente dividido entre el costo total, por lo que tanto el numerador como el denominador son inciertos
  • Se presentan dos tipos de rangos
    • Rango donde solo cambia el costo de ese componente: la participación cuando ese componente está en el percentil 5 o 95 y los otros tres componentes están en la mediana
    • Rango donde todos los componentes cambian a valores extremos: la participación cuando ese componente está en un extremo del intervalo de confianza y todos los demás están simultáneamente en el extremo opuesto

Participación trimestral de componentes

  • 1er trimestre de 2024

    • La participación de memoria fue de 52%, con un rango de 48~56% cuando solo cambiaba el costo de ese componente, y de 42~62% cuando todos los componentes variaban a valores extremos
    • La participación de lógica fue de 14%, con un rango de 12~17% cuando solo cambiaba el costo de ese componente, y de 10~20% cuando todos los componentes variaban a valores extremos
    • La participación de empaquetado fue de 19%, con un rango de 14~24% cuando solo cambiaba el costo de ese componente, y de 12~27% cuando todos los componentes variaban a valores extremos
    • La participación de componentes auxiliares fue de 15%, con un rango de 13~18% cuando solo cambiaba el costo de ese componente, y de 11~21% cuando todos los componentes variaban a valores extremos
  • 4º trimestre de 2025

    • La participación de memoria fue de 63%, con un rango de 60~67% cuando solo cambiaba el costo de ese componente, y de 54~73% cuando todos los componentes variaban a valores extremos
    • La participación de lógica fue de 13%, con un rango de 10~16% cuando solo cambiaba el costo de ese componente, y de 9~19% cuando todos los componentes variaban a valores extremos
    • La participación de empaquetado fue de 15%, con un rango de 11~19% cuando solo cambiaba el costo de ese componente, y de 9~22% cuando todos los componentes variaban a valores extremos
    • La participación de componentes auxiliares fue de 10%, con un rango de 8~10% cuando solo cambiaba el costo de ese componente, y de 7~12% cuando todos los componentes variaban a valores extremos

Supuestos y limitaciones

  • Los costos de componentes pueden variar según contrato, proveedor y momento, por lo que existe incertidumbre en las estimaciones de costo por chip
  • También existe incertidumbre en las estimaciones del volumen trimestral de producción de chips y en la composición por tipos de chip, y esa incertidumbre se refleja en las proporciones reportadas

Datos y herramienta de exploración

1 comentarios

 
GN⁺ 2 시간 전
Comentarios de Hacker News
  • Parece que para la inferencia y el entrenamiento de IA hay una ruta para reducir los costos de hardware en unas 3 veces y los costos totales en unas 2 veces, incluso sin ninguna innovación tecnológica
    Solo hace falta que la oferta de DRAM alcance la demanda; ya sea expandiendo la fabricación o cubriendo el aumento de la demanda con el ritmo actual de producción, es solo cuestión de tiempo

    • Si además se considera el margen de Nvidia inflado por la escasez actual de chips de punta, el margen para bajar costos podría ser mucho mayor
      Hay mucho que criticar de las cosas que Sam Altman ha difundido culturalmente, pero a largo plazo, la frase “ahora es lo peor que va a ser” me parece un punto bastante interesante y subestimado
      En 10 años, entrenar LLM del nivel actual probablemente será una suposición tan básica como operar bases de datos hoy. El nivel actual ya es bastante avanzado, y aun aparte del progreso del hardware, creo que hay mucho margen de mejora adicional con solo construir mejores esquemas de entrenamiento con aprendizaje por refuerzo
      Recomiendo mucho revisar los proyectos de GitHub y HF del Allen Institute. Hay materiales open source para entrenar LLM desde cero con Common Crawl y ajustes interesantes de qwen, así que se puede probar cómo podrían verse pronto los proyectos de una tarde o los materiales educativos
    • Las empresas de memoria no van a aumentar mucho la oferta para igualar la demanda
      Esta industria tiende a mantener el mercado en escasez de oferta, porque si no, el exceso de oferta posterior termina dañando a las empresas. En su lugar, la oferta de áreas menos rentables, como móvil y computación personal, simplemente se reasignará hacia los segmentos más rentables
    • Parece que la jugada tan elegante con la que Sam Altman intentó dominar el mercado de memoria produjo consecuencias no previstas
    • Me pregunto si aumentará la adopción de formatos de punto flotante alternativos
      El punto flotante IEEE es notoriamente malo en anchos de bit bajos, especialmente en 16 bits o menos. Formatos como posit son mucho mejores en 16 bits u 8 bits. Si se pudiera entrenar con 16 bits por valor en vez de 32, y la pérdida de precisión fuera mucho menor que al pasar de IEEE32 a IEEE16, sería bastante importante
    • Me pregunto cuál es la vida útil y la posibilidad de reacondicionamiento de componentes de gasto de capital como los módulos “GPU” o la DRAM soldada dentro de ellos
  • Hace unos años compré 96 GB de RAM por unos 250 dólares, y ahora esa misma RAM cuesta 1200 dólares

    • El 22 de octubre del año pasado compré RAM Crucial 96 GB DDR5 5600MHz SO-DIMM por 279 dólares
      Ahora en Amazon ese mismo kit cuesta 1,048.90 dólares
    • Me da muchísima rabia no haber llenado mi servidor principal al máximo cuando tuve la oportunidad
      Los módulos de memoria enterprise usados estaban regalados en eBay
    • Hace 1 año compré 192 GB DDR3 literalmente por 60 dólares, 5 dólares por módulo
      Ahora están como en 22 dólares por módulo, así que serían unos 350 dólares en total. No tengo idea de quién está haciendo qué con DDR3
    • La idea previa de que se podían conseguir decenas de GB de RAM barata se vino completamente abajo
      El valor de SSD ultrarrápidos como Optane podría volverse mucho mayor
    • Ordenando el garaje encontré dos unidades Samsung EVO de 4 TB sin usar
  • En todo lo que leo, parece que la capacidad de RAM aumentará alrededor de 20~25% al año, pero no parece suficiente
    Incluso para uso de consumo, los teléfonos y laptops mejorarían mucho si duplicaran la RAM, y ni hablar de la enorme demanda de IA
    No parece que esta tendencia vaya a desaparecer. Tal vez no crezca tan rápido como ahora, pero tampoco va a irse. Entiendo por qué las empresas de memoria no quieren llevarse a sí mismas a la quiebra, pero debería haber alguna manera de trasladar ese riesgo a los proveedores de modelos u otros participantes del ecosistema para aumentar la capacidad de RAM cerca de 50% al año

    • Solo el acuerdo con OpenAI podría absorber 2 años de ese crecimiento
      En un mercado competitivo, es ineficiente que los fabricantes de RAM dejen compradores sin venderles
      No sé cuál era realmente la tasa de crecimiento antes de octubre, pero seguro alguien aquí la conoce
    • El mayor riesgo es que el lado chino de CXML termine beneficiándose, capture el mercado que otros dejaron desatendido y, cuando los costos empiecen a normalizarse, compita y desplace a los actores actuales
      Sobre que un crecimiento de 20~25% no basta, tampoco me parece una cifra tan descabellada si se asume que los planes de expansión de centros de datos chocan con un muro, se desaceleran fuerte y se enfría el entusiasmo por la IA
      A corto plazo, puede que 20~25% no sea suficiente, pero si la expansión de IA se detiene este año, en vez de escasez habría un exceso de oferta enorme
    • En teoría, un nuevo mercado de futuros para componentes de chips podría ayudar
      Porque permitiría a los proveedores de DRAM cubrir ese riesgo
    • Según un artículo reciente, HBM es 3 veces menos eficiente que LPDDR en términos de área de wafer, pero ofrece más de 3 veces el ancho de banda
      ¿Y si para todos fuera mejor comprar computadoras, por ejemplo, a 1/3 de velocidad y cambiar todo a HBM?
      La brecha entre cómputo y memoria lleva mucho tiempo creciendo, y quizá cambiar a HBM, aunque sea doloroso, sea justo lo que hace falta
      ¿Es mejor tener 3 computadoras de gama media con poco ancho de banda de memoria, o esperar un poco más estadísticamente para que todos compren computadoras nuevas a 1/3 de velocidad en proporción de área pero con mucho más ancho de banda?
  • Viendo la tendencia actual, de verdad me pregunto cómo se va a sostener el mercado de consumo para cosas como gaming o machine learning
    El gaming en la nube claramente llegará en el futuro, y probablemente solo puristas como yo comprarán una RTX 5090 y pagarán un premium por jugar offline

    • A largo plazo, el gaming en la nube es inevitable
      Porque es económicamente más eficiente amortizar entre varios consumidores el costo del hardware necesario para renderizar gráficos, no dejarlo ocioso cuando no se usa y desplegarlo en POP junto con los assets del juego
      Si suficiente cómputo para juegos corre en el edge, también se vuelven posibles juegos más avanzados técnicamente que hoy no son viables económicamente. Creo que no vemos muchos juegos así ahora porque todavía faltan mercado y adopción de cloud gaming, y por lo tanto también falta know-how técnico
      En el momento en que sea demasiado caro asumir el costo de renderizar con hardware de consumo los juegos que la gente quiere, al final incluso quienes se resistían serán convencidos y este modelo podría consolidarse
  • No me voy a mover de una build con DDR4 hasta que los precios vuelvan al menos parcialmente a la normalidad
    Todavía tengo 32 GB de memoria DDR4 2133MHz de respaldo que compré antes, y ahora uso 3200MHz. Eso significa que los fabricantes de CPU tampoco van a recibir mi dinero. El 5800X me alcanza por bastante tiempo, y tampoco tengo motivo para comprar un GPU nuevo. Claro, el B580 no es perfecto

    • ¿Y si los precios de ahora fueran el mínimo histórico de aquí en adelante?
  • Es muy irónico que Irán haya bloqueado el suministro de helio
    Al mismo tiempo, Irán depende de propaganda barata generada por IA para sacudir a sus enemigos. Parece una de esas ironías que la historia revela tarde

  • Para los gamers y aficionados a la PC que no están completamente metidos en IA, este es un momento realmente horrible

    • Esto va a matar al 100% el mercado de PC armadas en casa
      Cuando empecé a armar PCs para gaming, la tarjeta gráfica tope de gama costaba 750 dólares neozelandeses. Ahora solo el GPU cuesta 10,000 dólares y además hay que sumarle otros 1,000~2,000 dólares de RAM
      Antes una PC gamer era un hobby accesible, pero ahora hasta la aviación general parece una alternativa razonable
    • Yo diría más bien lo contrario
      A corto plazo sí, el segmento aficionado está bajo presión, pero el capital necesario para empujar la frontera no es tan grande comparado con el de las Fortune 500. Pronto los aficionados también verán beneficios, y especialmente si el mercado colapsa
    • También es un momento horrible para quienes sí están completamente metidos en IA
  • Me pregunto por qué los hyperscalers no hacen más integración vertical y construyen sus propias fabs
    Aunque una fab costara 1,000 millones de dólares, ahora mismo están gastando cientos de miles de millones en comprar chips de Nvidia y otros proveedores

    • No sé si necesariamente tienen que integrarse verticalmente; quizá sería mejor financiar directamente la expansión de capacidad de producción, como hace Apple cuando escala nuevas tecnologías para el iPhone
      Pero el hecho de que los hyperscalers y las empresas de IA no lo hagan dice mucho sobre cuánto creen realmente en la demanda futura de IA
      Las empresas de IA dicen que hace falta una expansión masiva enorme, pero no quieren asumir el riesgo de capital necesario para esa expansión
      Se escucha mucho el lamento triste del lado de la IA de que los fabricantes de chips los están frenando, pero ¿quién tiene realmente el dinero para financiar fácilmente esa expansión? Los fabricantes de chips llevan muchísimo más tiempo en este juego. Cuando Sam Altman andaba diciendo que hacían falta fabs por 7 billones de dólares, las empresas de IA demostraron que estaban dispuestas a hacer afirmaciones absurdas y perdieron credibilidad
      Lo que hace falta ahora es que una parte muy pequeña de la enorme caja que han acumulado fluya directamente a financiar fabs
    • Las fabs están entre las tecnologías de punta más complejas que existen
      Es una especie de “rocket science” actual, y no es algo que se resuelva solo con dinero. Hay una posibilidad muy alta de quemar miles de millones de dólares y no conseguir nada
      Basta ver lo mucho que Intel ha sufrido para competir en los últimos años. Es una empresa que lleva décadas en este negocio
    • Incluso con el know-how necesario, construir una fab toma años
      Si no tienes ese know-how, hacen falta experimentos adicionales antes de poder competir con los fabricantes existentes. Para cuando logres producir chips útiles, la escasez de oferta quizá ya haya terminado
    • Los márgenes promedio de una fab son muy delgados comparados con los de las big tech, y por lo mismo el riesgo también es grande
      Probablemente no sea un negocio en el que quieran integrarse
    • Una sola fab cuesta 15~20 mil millones de dólares y tarda al menos 5 años en construirse
      Además requiere una especialización que ninguna de esas empresas tiene
  • Hace una semana compré un servidor Dell usado
    El precio de todo el equipo, con CPU de 12 núcleos y 32 GB de RAM DDR4 ECC, fue parecido al de comprar solo 64 GB de DDR RAM. Espero que esta situación absurda termine pronto. Si no, el dolor va a contagiarse a otros mercados. Hace poco leí que la venta de gabinetes para PC se desplomó más de 40%

    • Por el aumento del costo unitario de la RAM, la gente pobre ya está siendo expulsada incluso del segmento de teléfonos baratos
      https://www.cnet.com/tech/mobile/smartphone-sales-to-plummet...
    • Para cuando estalle la burbuja de la IA, siento que el mercado de PC va a estar dañado sin posibilidad de recuperación
      Los fabricantes que pasaron a producir componentes “enterprise” no van a volver al mercado de componentes para consumo. Para entonces ese mercado ya no va a existir
      Y cuando sobren centros de datos que no logren ganar dinero con contenido generado de baja calidad, se reutilizarán para SaaS. Algo como OnShape extendido a todas las aplicaciones
      A la mayoría de los usuarios no parece importarles mucho guardar en servicios en la nube todo lo que generan, y eso se puede vender fácilmente como alternativa a poseer hardware de escritorio o laptop “caro”
    • También puede verse desde otro ángulo
      Si los hyperscalers usan más RAM y esa RAM no llega a los consumidores, eso significa que todo el trabajo pesado ocurre en la nube
      ¿Por qué los hyperscalers y los consumidores tendrían que tener RAM al mismo tiempo? Los consumidores querrán más RAM para correr modelos locales, pero entonces la capacidad de los hyperscalers quedaría ociosa
  • Los fabricantes de memoria tienen montañas de propiedad intelectual
    Así que, aunque alguien tuviera capacidad ociosa en fabs y quisiera entrar a fabricar memoria, tendría que pelear contra una barrera enorme de patentes
    La mayoría de las empresas de memoria tienen acuerdos tras bambalinas para compensar mutuamente las infracciones de patentes entre ellas
    No veo bien cómo podría surgir un nuevo fabricante de memoria sin hundirse en costos de licencias