- Hopsworks migró con éxito a OVHCloud en el cuarto trimestre de 2024 para reducir los altos costos de egress de AWS, y redujo sus costos en un 62%
- En particular, el costo de salida de red fue un factor clave en la reducción total: en AWS costaba $90 por 1TB, mientras que en OVH era de solo $11 por 1TB, es decir, apenas 1/8
- AWS ofrece un ecosistema maduro y alta confiabilidad, pero OVHCloud ofrece una estructura de precios simple y un rendimiento competitivo a menor costo
- Kubernetes administrado: AWS → $0.10 por hora por clúster ($72/mes) / OVHCloud → gratis
- Costo de salida de red: AWS → $90 por 1TB / OVHCloud → $11 por 1TB (gratis en zonas locales)
- Almacenamiento S3: AWS → $2300/mes por 1TB / OVHCloud → $800/mes por 1TB
- Costo de solicitudes Put/Get: AWS → $566 por 100 millones de solicitudes / OVHCloud → gratis
- Registro de contenedores: AWS → $212/mes por 5TB / OVHCloud → $212/mes por 5TB ($44/mes por 600GB)
- Transferencia de datos entre zonas de disponibilidad: AWS → $2000 por 100TB / OVHCloud → gratis
- Instancias EBS: AWS → $81.92/mes por 1TB → OVHCloud / $97.28/mes por 1TB
Introducción a Hopsworks
- Hopsworks es una plataforma abierta para desarrollar y operar sistemas de IA a gran escala
- Puede desplegarse en cualquier clúster de Kubernetes (incluyendo nubes públicas y centros de datos independientes)
- Puede usarse como alternativa a plataformas de MLOps como AWS Sagemaker, GCP Vertex y Databricks
- En el artículo de investigación SIGMOD24 se destacó su mejor desempeño en IA en tiempo real y su excelente integración entre Python y Lakehouse
- Es reconocido como el primer Feature Store para ML
- Soporte de datos y cómputo
- Capa Lakehouse: usa Delta Lake, Apache Hudi e Iceberg (próximamente) → soporta almacenamiento de grandes volúmenes de datos históricos e inferencia por lotes
- Base de datos de baja latencia RonDB: soporta cargas de trabajo de IA en tiempo real y modelos de datos de esquema snowflake
- Soporte de cómputo: soporta Python, Spark, Ray y compartición/optimización de GPU en Kubernetes
- También puede aportar su propio cómputo → usar Hopsworks como capa de datos para integrar pipelines de IA
- Soporte para registro y despliegue de modelos: los modelos pueden desplegarse en KServe/vLLM
- Hopsworks Serverless (versión premium)
- Ofrece almacenamiento gratuito (50GB de datos Lakehouse, 100MB de datos de features en RonDB)
- Soporta hasta 100 registros de modelos y 2 despliegues de modelos
- Gran parte del almacenamiento es gratuito, pero no ofrece recursos de cómputo gratis → el costo de hosting en AWS puede mantenerse alrededor de $8K al mes
Contexto de la decisión de migrar de AWS a OVH
- Lanzamiento de Hopsworks Query Service y preocupación por el aumento del costo de salida de datos (egress)
- El cliente de Python usa Arrow y DuckDB → permite leer desde DataFrames de Pandas datos de cientos de MB hasta varios GB
- Se identificó el riesgo de un fuerte aumento en los costos de egress en AWS
- Decisión de migrar a OVHCloud
- OVH es un proveedor de nube con base en Europa que ofrece todos los servicios administrados necesarios
- Proporciona Kubernetes administrado, registro de contenedores administrado y almacenamiento de objetos compatible con S3
- Instalaron Hopsworks en OVH usando Helm Charts → confirmaron que funcionaba sin problemas
- Como la mayoría de los usuarios están en Norteamérica, decidieron mantener la infraestructura de OVH en Norteamérica
Efecto de la reducción de costos
- Tras migrar a OVH, los costos se redujeron en 62%
- Se eliminó la carga de los altos costos de egress de AWS
- Se mejoró la eficiencia de costos manteniendo el rendimiento de almacenamiento y cómputo en un entorno serverless
Migración de servicios de AWS a servicios de OVHCloud
- Solo dependían de Kubernetes y S3 → se diseñó para no depender de servicios específicos de una nube
- Stack de observabilidad: basado en OpenSearch y OpenSearch Dashboards
- Stack de métricas: basado en Prometheus y Grafana
Comparación de servicios de Kubernetes administrado
- Tanto AWS como OVHCloud ofrecen servicios de Kubernetes administrado
- AWS ofrece un ecosistema maduro y alta confiabilidad
- OVHCloud lo ofrece gratis y tiene ventaja en costos
- AWS ofrece Amazon Elastic Kubernetes Service (EKS), un servicio maduro y ampliamente usado con alta disponibilidad y un ecosistema sólido. Sin embargo, el costo del plano de control por clúster es de $0.10 por hora, lo que equivale a unos $72 al mes
- OVHCloud ofrece OVHCloud Kubernetes (Kubernetes totalmente administrado), con buena estabilidad, aunque el límite de 400MB de capacidad de etcd puede causar problemas en algunos clústeres de Kubernetes. Sin embargo, el costo del plano de control de Kubernetes administrado es gratuito
Comparación de costos de salida de red
- OVHCloud tiene costos de salida de red muy bajos
- OVHCloud cobra salida de red solo en algunas regiones nuevas (aprox. 1/8 del costo de AWS)
- En muchas regiones de nube, la salida de red es gratuita (a marzo de 2025)
- AWS tiene costos de salida muy altos, lo que aumenta la carga de costos
- AWS presta servicios en todo el mundo y el costo de salida de datos es de $0.09 por GB, lo que supone $90 al mes por transferir 1TB
- OVHCloud ofrece servicios en Europa y Norteamérica
- En las "zonas locales", la salida de red es gratuita
- En otras regiones, cuesta $0.011 por GB, es decir, $11 por transferir 1TB
Comparación de servicios de almacenamiento S3
- AWS S3 tiene alta confiabilidad y disponibilidad, pero es costoso
- AWS ofrece un rendimiento de primer nivel en servicios de almacenamiento de objetos en la nube
- OVHCloud S3 mantiene la confiabilidad, pero cuesta aproximadamente un tercio que AWS
- AWS S3 es considerado el servicio más confiable, y el costo de almacenamiento es de $0.023 por GB, lo que implica $2300 al mes por almacenar 100TB
- Put, Copy, List y Post cuestan $0.005 por cada 1000 solicitudes, y GET y SELECT cuestan $0.0004 por cada 1000 solicitudes, por lo que 100 millones de operaciones cuestan alrededor de $566 al mes
- OVHCloud S3 ofrece buena confiabilidad y bajo costo de almacenamiento
- El costo de almacenamiento es de $0.008 por GB, lo que implica $800 al mes por almacenar 100TB
- Las operaciones Put/Get son gratuitas
Comparación de servicios de registro de contenedores
- AWS ECR es un servicio administrado maduro y escalable
- Es altamente escalable y flexible de configurar
- OVHCloud Harbor usa una tarifa fija, por lo que puede tener limitaciones de escalabilidad
- AWS ECR ofrece un servicio escalable y maduro
- El costo de almacenamiento es de $0.10 por GB, lo que implica $212 al mes por almacenar 5TB
- En términos generales, ofrece mejor rendimiento que OVHCloud
- OVHCloud Harbor tiene límites en el número de conexiones simultáneas (45 o 90)
- El costo de almacenamiento es de $44 al mes por 600GB y de $212 al mes por 5TB
- No permite una expansión flexible para capacidades de almacenamiento superiores a 5TB
Comparación de costos de transferencia de datos entre zonas de disponibilidad
- Hopsworks replica servicios entre instancias para tolerar fallas de zonas de disponibilidad (AZ)
- Esto genera tráfico de red entre instancias ubicadas en distintas zonas de disponibilidad
- AWS cobra $0.02 por GB por transferencia de datos ($0.01 de salida + $0.01 de entrada)
- Transferir 100TB cuesta $2000 al mes
- OVHCloud no cobra por la transferencia de datos entre zonas de disponibilidad
Comparación de instancias EBS
- Hopsworks usa EBS (Block Storage) para servicios que requieren volúmenes persistentes
- AWS usa Elastic Block Storage
- OVH usa Block Storage basado en Ceph
- Algunas instancias usan discos NVMe locales → OVH ofrece mayor throughput para almacenamiento pequeño (1~4TB)
- AWS ofrece una mayor variedad de instancias, pero el almacenamiento local NVMe solo está disponible en discos grandes
- El costo es de $0.08 por GB, es decir, $81.92 al mes por 1TB
- OVHCloud ofrece menos tipos de instancias, pero tiene buen rendimiento NVMe en almacenamiento pequeño
- El costo es de $0.095 por GB, es decir, $97.28 al mes por 1TB
Proceso real de migración
- Aviso del calendario de mantenimiento
- El 26 de noviembre de 2024 se anunció una ventana de mantenimiento de 24 horas
- Respaldo y ejecución de la migración
- Se respaldó el clúster de Hopsworks en un bucket S3 de AWS y luego se migró al bucket S3 de OVHCloud
- Hubo algo de tiempo de inactividad, pero la migración se completó sin problemas
- Pruebas y reanudación de operaciones
- Se desplegó el clúster de Hopsworks en OVH con Helm charts
- Tras el proceso de pruebas y verificar que no había problemas, se reanudó el inicio de sesión
- Después de la migración no hubo problemas con las cuentas de usuario
Resumen
- En el cuarto trimestre de 2024, se completó la migración de miles de usuarios desde AWS a OVHCloud
- Tanto OVH como Hopsworks son tecnologías desarrolladas en Europa, pero el servicio serverless de Hopsworks se ofrece en Norteamérica, donde se encuentra la mayoría de sus usuarios
- La estructura de precios simple y baja de OVH resulta atractiva
- No solo el costo de salida de red, sino también la mayoría de los servicios son más baratos
- La calidad general del servicio también es excelente
2 comentarios
AWS también tiene como fortaleza que cuenta con muchas referencias,
pero cuando intentas operar aplicaciones empresariales,
sí parece que los costos son brutales.
Si en otros CSP también hubiera muchas referencias y la estabilidad estuviera garantizada, creo que valdría la pena considerar una migración por un costo más bajo.
Opiniones de Hacker News
OVH es conocido como un proveedor de hosting más barato que AWS. Me pregunto si lo compensa en términos de ingeniería y alta disponibilidad
En Canadá estamos considerando salir de AWS. OVH no tiene buena reputación en Canadá
Como miembro del equipo, estoy dispuesto a conversar si hay preguntas sobre la migración
Nuestra empresa también usa OVH. Está bastante bien y es barato
Tras trabajar con AWS durante 3 años, AWS es un socio comercial aceptable
Si los números cierran y pueden migrar, perfecto
Usé OVH para un proyecto personal, pero lo dejé. Bloqueaban aleatoriamente IPs de la red de iCloud Private Relay
Al migrar datos a OVH, hay que respaldar todos los datos en otro proveedor
Me pregunto por qué eligieron Scaleway.com en lugar de OVH
No hay razón para quedarse en AWS o Azure, pero como las alternativas tienen menos marketing, es difícil convencer a la dirección