- AWS aumentó alrededor de 15% el precio de las instancias GPU de EC2 Capacity Blocks for ML; las tarifas por hora de las instancias p5e.48xlarge y p5en.48xlarge subieron en la mayoría de las regiones de $34.61→$39.80 y $36.18→$41.61, respectivamente
- En la región US West (Northern California) el aumento fue mayor, de $43.26→$49.75
- AWS explicó por correo electrónico que “este ajuste refleja los patrones de oferta y demanda”
- Este aumento ocurrió después del anuncio de una reducción de hasta 45% en instancias GPU (hace 7 meses) y es un caso poco común en el que AWS sube precios directamente
- El hecho rompe la regla no escrita de las rebajas de precios en la industria cloud y podría afectar a otros servicios de recursos en el futuro
Resumen del aumento de precios de GPU en AWS
- AWS subió alrededor de 15% los precios de EC2 Capacity Blocks for ML durante el fin de semana, un sábado
- La instancia p5e.48xlarge pasó de $34.61 a $39.80 por hora, y la p5en.48xlarge de $36.18 a $41.61
- En US West (Northern California) el aumento fue mayor: de $43.26 a $49.75
- En la página oficial de precios de AWS aparecía el mensaje de que “los precios se actualizarán en enero de 2026”, pero no se indicaba que serían al alza
- AWS explicó por correo que “los precios varían según los patrones de oferta y demanda, y este ajuste refleja los patrones esperados para ese trimestre”
Naturaleza de Capacity Blocks y tipo de usuarios
- Capacity Blocks es un servicio que permite reservar y garantizar recursos GPU en un momento específico para ejecutar de forma estable trabajos de entrenamiento de ML
- Se pueden reservar instancias GPU para un periodo específico, desde un día hasta varias semanas después, pagando una tarifa fija por adelantado
- Los clientes que usan este servicio son en su mayoría equipos empresariales que ejecutan proyectos de ML a gran escala, con presupuestos de millones de dólares
- Hace 7 meses AWS redujo hasta 45% los precios on-demand y de Savings Plans para instancias GPU, pero este aumento aplica solo a Capacity Blocks
Impacto en la industria y en los clientes
- AWS ya ha ajustado precios en el pasado, pero un aumento directo de una línea de precio (line-item increase) es poco común
- Antes lo habitual era cambiar la estructura de precios o promocionarlo diciendo que “para la mayoría de los clientes el efecto era una reducción”
- Este aumento ofrece un punto de comparación favorable para Azure y GCP
- Ambos competidores están impulsando activamente la captación de cargas de trabajo de ML, y el hecho de que “AWS subió 15% el precio de las GPU” podría usarse como argumento comercial
- Los clientes empresariales que usan el Enterprise Discount Program (EDP) mantendrán su porcentaje de descuento, pero su costo real aumentará por el alza en el precio base
Situación del mercado y perspectivas
- Con una oferta global de GPU limitada, este aumento se interpreta como una señal de desequilibrio entre oferta y demanda
- Durante 20 años AWS había consolidado la idea de que “los precios siempre bajan”, pero esta medida rompe esa premisa
- Una vez que se sube el precio y la reacción del mercado no es fuerte, aumenta la probabilidad de más incrementos
- Se menciona la posibilidad de ajustes similares en otros servicios, como las instancias Graviton o los costos de transferencia de datos
- El artículo señala que “la creencia de que los precios cloud solo iban en una dirección desapareció un sábado de enero de 2026”
Conclusión
- Este aumento en el precio de las GPU se evalúa como un punto de inflexión en la política de precios de AWS
- Se convirtió en un factor que debilita la confianza en la estabilidad de costos dentro del mercado cloud, y
se plantea la posibilidad de más incrementos futuros en recursos con restricciones de oferta
1 comentarios
Comentarios de Hacker News
Al ver que suben los precios de las GPU, la RAM y los discos duros, uno termina imaginando un futuro en el que las computadoras domésticas sean reemplazadas por clientes ligeros (thin clients) y todo el cómputo se mueva a servicios por suscripción
Podrían volverse realidad consignas como “no necesitas almacenamiento, usa una suscripción en la nube” o “no necesitas potencia de procesamiento, haz streaming de tus juegos”
Las empresas de videojuegos ya están considerando modelos de cobro por hora, así que la estructura de juegos como Call of Duty o GTA podría cambiar por completo
Los medios físicos podrían desaparecer, el almacenamiento del iPhone reducirse y todo quedar forzado hacia iCloud
También hace pensar en una sociedad de autos compartidos autónomos en lugar de propiedad de vehículos, y en el cierre de tiendas físicas a favor de entregas con drones
La frase “hopes you weren't paying attention” del título del artículo se siente exageradamente sensacionalista
Parece una simple dinámica de mercado en la que la demanda de GPU y RAM supera la oferta
Sobre el artículo del aumento de precios de AWS, confunde que diga “actualización próxima” sin indicar la dirección del cambio, es decir, si se trata de un aumento o una reducción
Quienes ya son clientes no revisan la página de precios todos los días, así que este tipo de aviso es en la práctica una comunicación opaca
Hubo críticas por extender la depreciación de las GPU de 3 a 5 años, pero este aumento de precio más bien parece mostrar que la vida útil del valor de las GPU se está alargando
La IA en la nube no es más que un impuesto a la conveniencia (convenience tax) para la mayoría de las empresas
Documentos, predicción, monitoreo, soporte y sistemas de control pueden resolverse perfectamente con modelos locales. Si se consideran la gravedad de los datos, la latencia y la privacidad, tener hardware en el edge resulta más razonable
Parece que pronto llegará un shock de precios a toda la industria de IA
La IA está absorbiendo todos los recursos y asfixiando a otras industrias
Me pregunto si existe algún servicio que siga las variaciones del precio de las GPU por hora
Me dio gusto ver a Corey Quinn aparecer en The Register
El aumento explosivo del gasto de capital por las compras masivas de GPU está empujando hacia arriba la demanda de otros componentes, como la memoria
Pero queda la duda de cuánto se están usando realmente esas GPU. Hace pensar si no estaremos pagando por inventario ocioso