1 puntos por GN⁺ 2026-01-07 | 1 comentarios | Compartir por WhatsApp
  • AWS aumentó alrededor de 15% el precio de las instancias GPU de EC2 Capacity Blocks for ML; las tarifas por hora de las instancias p5e.48xlarge y p5en.48xlarge subieron en la mayoría de las regiones de $34.61→$39.80 y $36.18→$41.61, respectivamente
  • En la región US West (Northern California) el aumento fue mayor, de $43.26→$49.75
  • AWS explicó por correo electrónico que “este ajuste refleja los patrones de oferta y demanda
  • Este aumento ocurrió después del anuncio de una reducción de hasta 45% en instancias GPU (hace 7 meses) y es un caso poco común en el que AWS sube precios directamente
  • El hecho rompe la regla no escrita de las rebajas de precios en la industria cloud y podría afectar a otros servicios de recursos en el futuro

Resumen del aumento de precios de GPU en AWS

  • AWS subió alrededor de 15% los precios de EC2 Capacity Blocks for ML durante el fin de semana, un sábado
    • La instancia p5e.48xlarge pasó de $34.61 a $39.80 por hora, y la p5en.48xlarge de $36.18 a $41.61
    • En US West (Northern California) el aumento fue mayor: de $43.26 a $49.75
  • En la página oficial de precios de AWS aparecía el mensaje de que “los precios se actualizarán en enero de 2026”, pero no se indicaba que serían al alza
  • AWS explicó por correo que “los precios varían según los patrones de oferta y demanda, y este ajuste refleja los patrones esperados para ese trimestre”

Naturaleza de Capacity Blocks y tipo de usuarios

  • Capacity Blocks es un servicio que permite reservar y garantizar recursos GPU en un momento específico para ejecutar de forma estable trabajos de entrenamiento de ML
    • Se pueden reservar instancias GPU para un periodo específico, desde un día hasta varias semanas después, pagando una tarifa fija por adelantado
  • Los clientes que usan este servicio son en su mayoría equipos empresariales que ejecutan proyectos de ML a gran escala, con presupuestos de millones de dólares
  • Hace 7 meses AWS redujo hasta 45% los precios on-demand y de Savings Plans para instancias GPU, pero este aumento aplica solo a Capacity Blocks

Impacto en la industria y en los clientes

  • AWS ya ha ajustado precios en el pasado, pero un aumento directo de una línea de precio (line-item increase) es poco común
    • Antes lo habitual era cambiar la estructura de precios o promocionarlo diciendo que “para la mayoría de los clientes el efecto era una reducción”
  • Este aumento ofrece un punto de comparación favorable para Azure y GCP
    • Ambos competidores están impulsando activamente la captación de cargas de trabajo de ML, y el hecho de que “AWS subió 15% el precio de las GPU” podría usarse como argumento comercial
  • Los clientes empresariales que usan el Enterprise Discount Program (EDP) mantendrán su porcentaje de descuento, pero su costo real aumentará por el alza en el precio base

Situación del mercado y perspectivas

  • Con una oferta global de GPU limitada, este aumento se interpreta como una señal de desequilibrio entre oferta y demanda
  • Durante 20 años AWS había consolidado la idea de que “los precios siempre bajan”, pero esta medida rompe esa premisa
  • Una vez que se sube el precio y la reacción del mercado no es fuerte, aumenta la probabilidad de más incrementos
  • Se menciona la posibilidad de ajustes similares en otros servicios, como las instancias Graviton o los costos de transferencia de datos
  • El artículo señala que “la creencia de que los precios cloud solo iban en una dirección desapareció un sábado de enero de 2026

Conclusión

  • Este aumento en el precio de las GPU se evalúa como un punto de inflexión en la política de precios de AWS
  • Se convirtió en un factor que debilita la confianza en la estabilidad de costos dentro del mercado cloud, y
    se plantea la posibilidad de más incrementos futuros en recursos con restricciones de oferta

1 comentarios

 
GN⁺ 2026-01-07
Comentarios de Hacker News
  • Al ver que suben los precios de las GPU, la RAM y los discos duros, uno termina imaginando un futuro en el que las computadoras domésticas sean reemplazadas por clientes ligeros (thin clients) y todo el cómputo se mueva a servicios por suscripción
    Podrían volverse realidad consignas como “no necesitas almacenamiento, usa una suscripción en la nube” o “no necesitas potencia de procesamiento, haz streaming de tus juegos”
    Las empresas de videojuegos ya están considerando modelos de cobro por hora, así que la estructura de juegos como Call of Duty o GTA podría cambiar por completo
    Los medios físicos podrían desaparecer, el almacenamiento del iPhone reducirse y todo quedar forzado hacia iCloud
    También hace pensar en una sociedad de autos compartidos autónomos en lugar de propiedad de vehículos, y en el cierre de tiendas físicas a favor de entregas con drones

    • Los precios de las suscripciones también están subiendo. Quienes ya compraron una computadora pueden aguantar unos años, pero los usuarios de renta ya están sintiendo el impacto inmediato
    • Un reloj despertador (Hatch.co) que me regalaron en Navidad no funciona sin una suscripción anual de 50 dólares. Los consumidores necesitan entender mejor el costo total de propiedad (TCO). Tal vez el gobierno debería exigir una etiqueta con el costo anual, como en los electrodomésticos
    • La cadena de suministro es tan frágil que, con TSMC teniendo 60% de participación de mercado, si China invadiera Taiwán podría desaparecer más de la mitad de la producción mundial de CPU y GPU. En ese escenario, tal vez dejarían de vender iPhones por completo, y una sola PC podría costar 5 mil dólares
    • Los MMORPG ya usan desde hace mucho un modelo de suscripción mensual. Pero en la mayoría de los juegos, cambiar a cobro por hora probablemente reduciría las ganancias, porque la gente compra muchos juegos pero en realidad casi no los juega
    • Esta tendencia ya ha sido teorizada bajo el concepto de Technofeudalism (tecnofeudalismo) (enlace a Wikipedia)
  • La frase “hopes you weren't paying attention” del título del artículo se siente exageradamente sensacionalista
    Parece una simple dinámica de mercado en la que la demanda de GPU y RAM supera la oferta

    • Es el tipo de titular provocador característico de The Register. Busca generar clics, pero esta vez claramente funcionó
    • La oferta de GPU y RAM no cambia de repente de un fin de semana a otro. No había ninguna razón especial para subir el precio justo un sábado
    • Resulta extraño que anunciaran el aumento de precio en sábado, cuando los clientes no están trabajando
    • Incluso con economía de preparatoria se puede señalar que estas empresas hasta ahora solo han generado deuda y baja productividad
  • Sobre el artículo del aumento de precios de AWS, confunde que diga “actualización próxima” sin indicar la dirección del cambio, es decir, si se trata de un aumento o una reducción
    Quienes ya son clientes no revisan la página de precios todos los días, así que este tipo de aviso es en la práctica una comunicación opaca

    • En los comentarios, alguien satiriza el método de anuncios de AWS con la broma de The Hitchhiker’s Guide to the Galaxy sobre “el aviso estaba dentro de un cajón cerrado en un baño con llave”
  • Hubo críticas por extender la depreciación de las GPU de 3 a 5 años, pero este aumento de precio más bien parece mostrar que la vida útil del valor de las GPU se está alargando

    • No soy experto, pero una subida de precios también podría ser señal de que la vida útil se acortó. Tanto una caída en la oferta como un aumento en la demanda son posibilidades. También podría ser que la demanda de GPU se haya vuelto inelástica, haciendo que el precio suba más
    • Depende de cuánto haya exagerado NVIDIA la mejora de rendimiento. Si las mejoras estructurales como funciones de RL, separación de prefill/decode o nvfp4 realmente elevaron la eficiencia, entonces los chips viejos siguen siendo bastante útiles
    • Las GPU de gama alta realmente pueden usarse más de 6 años. Con buena refrigeración, incluso cerca de 10 años. En especial, los modelos con 80 GB de VRAM o más conservan mucho valor a largo plazo
  • La IA en la nube no es más que un impuesto a la conveniencia (convenience tax) para la mayoría de las empresas
    Documentos, predicción, monitoreo, soporte y sistemas de control pueden resolverse perfectamente con modelos locales. Si se consideran la gravedad de los datos, la latencia y la privacidad, tener hardware en el edge resulta más razonable

    • Yo también estoy prototipando con LLM para varios usos, y el mayor problema no es el costo sino la confiabilidad. La diferencia entre 99.95% y 99% puede causar pérdidas mayores que el costo laboral. En áreas donde se puede hacer ese cálculo, sigo pensando que los humanos son mejores
  • Parece que pronto llegará un shock de precios a toda la industria de IA

    • Nuestro equipo no tiene ningún plan para cuando exploten los costos de API e infraestructura. Ahora estamos metiendo funciones de IA casi gratis como marketing, pero cuando aparezca el costo real quizá tengamos que quitarlas todas
    • Al final, mucho uso probablemente se moverá a modelos open-weight chinos. Salvo los modelos de gama más alta, para la mayoría de los casos de uso ya están en un nivel “good enough”
    • Este golpe no afectará solo a la industria de IA, sino a todos los sectores
    • Yo también, como usuario de Claude, me preocupo por este tipo de aumentos de precio
  • La IA está absorbiendo todos los recursos y asfixiando a otras industrias

    • Philip K. Dick y Frank Herbert ya habían anticipado con precisión esta estructura inmutable del capitalismo
  • Me pregunto si existe algún servicio que siga las variaciones del precio de las GPU por hora

    • Llevo un año desarrollando computeprices.com como proyecto paralelo precisamente para eso
    • Que AWS haya subido el precio de una instancia específica es inusual. Pero el problema mayor es la opacidad de subir precios sin aviso previo. Desde la perspectiva del cliente, así se pierde la confianza
  • Me dio gusto ver a Corey Quinn aparecer en The Register

  • El aumento explosivo del gasto de capital por las compras masivas de GPU está empujando hacia arriba la demanda de otros componentes, como la memoria
    Pero queda la duda de cuánto se están usando realmente esas GPU. Hace pensar si no estaremos pagando por inventario ocioso