9 puntos por GN⁺ 2025-03-15 | 2 comentarios | Compartir por WhatsApp
  • Hopsworks migró con éxito a OVHCloud en el cuarto trimestre de 2024 para reducir los altos costos de egress de AWS, y redujo sus costos en un 62%
  • En particular, el costo de salida de red fue un factor clave en la reducción total: en AWS costaba $90 por 1TB, mientras que en OVH era de solo $11 por 1TB, es decir, apenas 1/8
  • AWS ofrece un ecosistema maduro y alta confiabilidad, pero OVHCloud ofrece una estructura de precios simple y un rendimiento competitivo a menor costo
    • Kubernetes administrado: AWS → $0.10 por hora por clúster ($72/mes) / OVHCloud → gratis
    • Costo de salida de red: AWS → $90 por 1TB / OVHCloud → $11 por 1TB (gratis en zonas locales)
    • Almacenamiento S3: AWS → $2300/mes por 1TB / OVHCloud → $800/mes por 1TB
    • Costo de solicitudes Put/Get: AWS → $566 por 100 millones de solicitudes / OVHCloud → gratis
    • Registro de contenedores: AWS → $212/mes por 5TB / OVHCloud → $212/mes por 5TB ($44/mes por 600GB)
    • Transferencia de datos entre zonas de disponibilidad: AWS → $2000 por 100TB / OVHCloud → gratis
    • Instancias EBS: AWS → $81.92/mes por 1TB → OVHCloud / $97.28/mes por 1TB

Introducción a Hopsworks

  • Hopsworks es una plataforma abierta para desarrollar y operar sistemas de IA a gran escala
    • Puede desplegarse en cualquier clúster de Kubernetes (incluyendo nubes públicas y centros de datos independientes)
    • Puede usarse como alternativa a plataformas de MLOps como AWS Sagemaker, GCP Vertex y Databricks
    • En el artículo de investigación SIGMOD24 se destacó su mejor desempeño en IA en tiempo real y su excelente integración entre Python y Lakehouse
    • Es reconocido como el primer Feature Store para ML
  • Soporte de datos y cómputo
    • Capa Lakehouse: usa Delta Lake, Apache Hudi e Iceberg (próximamente) → soporta almacenamiento de grandes volúmenes de datos históricos e inferencia por lotes
    • Base de datos de baja latencia RonDB: soporta cargas de trabajo de IA en tiempo real y modelos de datos de esquema snowflake
    • Soporte de cómputo: soporta Python, Spark, Ray y compartición/optimización de GPU en Kubernetes
      • También puede aportar su propio cómputo → usar Hopsworks como capa de datos para integrar pipelines de IA
    • Soporte para registro y despliegue de modelos: los modelos pueden desplegarse en KServe/vLLM
  • Hopsworks Serverless (versión premium)
    • Ofrece almacenamiento gratuito (50GB de datos Lakehouse, 100MB de datos de features en RonDB)
    • Soporta hasta 100 registros de modelos y 2 despliegues de modelos
    • Gran parte del almacenamiento es gratuito, pero no ofrece recursos de cómputo gratis → el costo de hosting en AWS puede mantenerse alrededor de $8K al mes

Contexto de la decisión de migrar de AWS a OVH

  • Lanzamiento de Hopsworks Query Service y preocupación por el aumento del costo de salida de datos (egress)
    • El cliente de Python usa Arrow y DuckDB → permite leer desde DataFrames de Pandas datos de cientos de MB hasta varios GB
    • Se identificó el riesgo de un fuerte aumento en los costos de egress en AWS
  • Decisión de migrar a OVHCloud
    • OVH es un proveedor de nube con base en Europa que ofrece todos los servicios administrados necesarios
      • Proporciona Kubernetes administrado, registro de contenedores administrado y almacenamiento de objetos compatible con S3
    • Instalaron Hopsworks en OVH usando Helm Charts → confirmaron que funcionaba sin problemas
    • Como la mayoría de los usuarios están en Norteamérica, decidieron mantener la infraestructura de OVH en Norteamérica

Efecto de la reducción de costos

  • Tras migrar a OVH, los costos se redujeron en 62%
  • Se eliminó la carga de los altos costos de egress de AWS
  • Se mejoró la eficiencia de costos manteniendo el rendimiento de almacenamiento y cómputo en un entorno serverless

Migración de servicios de AWS a servicios de OVHCloud

  • Solo dependían de Kubernetes y S3 → se diseñó para no depender de servicios específicos de una nube
    • Stack de observabilidad: basado en OpenSearch y OpenSearch Dashboards
    • Stack de métricas: basado en Prometheus y Grafana

Comparación de servicios de Kubernetes administrado

  • Tanto AWS como OVHCloud ofrecen servicios de Kubernetes administrado
    • AWS ofrece un ecosistema maduro y alta confiabilidad
    • OVHCloud lo ofrece gratis y tiene ventaja en costos
  • AWS ofrece Amazon Elastic Kubernetes Service (EKS), un servicio maduro y ampliamente usado con alta disponibilidad y un ecosistema sólido. Sin embargo, el costo del plano de control por clúster es de $0.10 por hora, lo que equivale a unos $72 al mes
  • OVHCloud ofrece OVHCloud Kubernetes (Kubernetes totalmente administrado), con buena estabilidad, aunque el límite de 400MB de capacidad de etcd puede causar problemas en algunos clústeres de Kubernetes. Sin embargo, el costo del plano de control de Kubernetes administrado es gratuito

Comparación de costos de salida de red

  • OVHCloud tiene costos de salida de red muy bajos
    • OVHCloud cobra salida de red solo en algunas regiones nuevas (aprox. 1/8 del costo de AWS)
    • En muchas regiones de nube, la salida de red es gratuita (a marzo de 2025)
    • AWS tiene costos de salida muy altos, lo que aumenta la carga de costos
  • AWS presta servicios en todo el mundo y el costo de salida de datos es de $0.09 por GB, lo que supone $90 al mes por transferir 1TB
  • OVHCloud ofrece servicios en Europa y Norteamérica
    • En las "zonas locales", la salida de red es gratuita
    • En otras regiones, cuesta $0.011 por GB, es decir, $11 por transferir 1TB

Comparación de servicios de almacenamiento S3

  • AWS S3 tiene alta confiabilidad y disponibilidad, pero es costoso
    • AWS ofrece un rendimiento de primer nivel en servicios de almacenamiento de objetos en la nube
    • OVHCloud S3 mantiene la confiabilidad, pero cuesta aproximadamente un tercio que AWS
  • AWS S3 es considerado el servicio más confiable, y el costo de almacenamiento es de $0.023 por GB, lo que implica $2300 al mes por almacenar 100TB
    • Put, Copy, List y Post cuestan $0.005 por cada 1000 solicitudes, y GET y SELECT cuestan $0.0004 por cada 1000 solicitudes, por lo que 100 millones de operaciones cuestan alrededor de $566 al mes
  • OVHCloud S3 ofrece buena confiabilidad y bajo costo de almacenamiento
    • El costo de almacenamiento es de $0.008 por GB, lo que implica $800 al mes por almacenar 100TB
    • Las operaciones Put/Get son gratuitas

Comparación de servicios de registro de contenedores

  • AWS ECR es un servicio administrado maduro y escalable
    • Es altamente escalable y flexible de configurar
    • OVHCloud Harbor usa una tarifa fija, por lo que puede tener limitaciones de escalabilidad
  • AWS ECR ofrece un servicio escalable y maduro
    • El costo de almacenamiento es de $0.10 por GB, lo que implica $212 al mes por almacenar 5TB
    • En términos generales, ofrece mejor rendimiento que OVHCloud
  • OVHCloud Harbor tiene límites en el número de conexiones simultáneas (45 o 90)
    • El costo de almacenamiento es de $44 al mes por 600GB y de $212 al mes por 5TB
    • No permite una expansión flexible para capacidades de almacenamiento superiores a 5TB

Comparación de costos de transferencia de datos entre zonas de disponibilidad

  • Hopsworks replica servicios entre instancias para tolerar fallas de zonas de disponibilidad (AZ)
    • Esto genera tráfico de red entre instancias ubicadas en distintas zonas de disponibilidad
  • AWS cobra $0.02 por GB por transferencia de datos ($0.01 de salida + $0.01 de entrada)
    • Transferir 100TB cuesta $2000 al mes
  • OVHCloud no cobra por la transferencia de datos entre zonas de disponibilidad

Comparación de instancias EBS

  • Hopsworks usa EBS (Block Storage) para servicios que requieren volúmenes persistentes
    • AWS usa Elastic Block Storage
    • OVH usa Block Storage basado en Ceph
    • Algunas instancias usan discos NVMe locales → OVH ofrece mayor throughput para almacenamiento pequeño (1~4TB)
  • AWS ofrece una mayor variedad de instancias, pero el almacenamiento local NVMe solo está disponible en discos grandes
    • El costo es de $0.08 por GB, es decir, $81.92 al mes por 1TB
  • OVHCloud ofrece menos tipos de instancias, pero tiene buen rendimiento NVMe en almacenamiento pequeño
    • El costo es de $0.095 por GB, es decir, $97.28 al mes por 1TB

Proceso real de migración

  • Aviso del calendario de mantenimiento
    • El 26 de noviembre de 2024 se anunció una ventana de mantenimiento de 24 horas
  • Respaldo y ejecución de la migración
    • Se respaldó el clúster de Hopsworks en un bucket S3 de AWS y luego se migró al bucket S3 de OVHCloud
    • Hubo algo de tiempo de inactividad, pero la migración se completó sin problemas
  • Pruebas y reanudación de operaciones
    • Se desplegó el clúster de Hopsworks en OVH con Helm charts
    • Tras el proceso de pruebas y verificar que no había problemas, se reanudó el inicio de sesión
    • Después de la migración no hubo problemas con las cuentas de usuario

Resumen

  • En el cuarto trimestre de 2024, se completó la migración de miles de usuarios desde AWS a OVHCloud
  • Tanto OVH como Hopsworks son tecnologías desarrolladas en Europa, pero el servicio serverless de Hopsworks se ofrece en Norteamérica, donde se encuentra la mayoría de sus usuarios
  • La estructura de precios simple y baja de OVH resulta atractiva
    • No solo el costo de salida de red, sino también la mayoría de los servicios son más baratos
    • La calidad general del servicio también es excelente

2 comentarios

 
kaydash 2025-03-15

AWS también tiene como fortaleza que cuenta con muchas referencias,
pero cuando intentas operar aplicaciones empresariales,
sí parece que los costos son brutales.
Si en otros CSP también hubiera muchas referencias y la estabilidad estuviera garantizada, creo que valdría la pena considerar una migración por un costo más bajo.

 
GN⁺ 2025-03-15
Opiniones de Hacker News
  • OVH es conocido como un proveedor de hosting más barato que AWS. Me pregunto si lo compensa en términos de ingeniería y alta disponibilidad

    • Trabajo en una consultora configurando infraestructura en la nube y reforzando la seguridad
    • Tenemos muchos clientes que usan desde AWS, Azure y GCP hasta pequeños proveedores regionales de nube
    • Usar un proveedor de nube pequeño puede reducir los costos aproximadamente a la mitad, pero puede requerir ingenieros con experiencia
    • Muchas empresas pequeñas se enfocan en AWS, pero si usas servicios exclusivos de AWS, no puedes migrar fácilmente a otro lugar
  • En Canadá estamos considerando salir de AWS. OVH no tiene buena reputación en Canadá

    • La mayor preocupación es una alternativa confiable a RDS-postgres
    • El costo no es la principal preocupación, pero ahorrar dinero sería un buen efecto secundario
    • Requisitos: buen soporte para OpenTofu (o Terraform), confiabilidad, buena base de datos administrada, centro de datos en Canadá
  • Como miembro del equipo, estoy dispuesto a conversar si hay preguntas sobre la migración

  • Nuestra empresa también usa OVH. Está bastante bien y es barato

    • La desventaja es que hace 6 años tuvimos una caída de todo el día por un problema eléctrico en el centro de datos
    • Ahora cambiamos a una arquitectura que usa varios proveedores de nube y operamos a menor costo que con AWS
  • Tras trabajar con AWS durante 3 años, AWS es un socio comercial aceptable

    • Es caro y en su mayor parte funciona bien, pero se puede notar la diferencia en los detalles de la confiabilidad
    • Debido al deterioro de las relaciones entre Europa y Estados Unidos, existe la posibilidad de que los servicios en la nube se conviertan en un arma
  • Si los números cierran y pueden migrar, perfecto

    • Asegúrense de tener bien definido un plan de respaldo. OVH perdió datos en un incendio
  • Usé OVH para un proyecto personal, pero lo dejé. Bloqueaban aleatoriamente IPs de la red de iCloud Private Relay

    • El registro SPF de su servicio de correo está mal configurado
    • No lo resolvieron durante más de un año, así que moví el correo a otro proveedor
  • Al migrar datos a OVH, hay que respaldar todos los datos en otro proveedor

    • Hubo un caso en que se incendió un centro de datos de OVH y también se perdieron los respaldos
  • Me pregunto por qué eligieron Scaleway.com en lugar de OVH

    • Scaleway también es una empresa europea y ofrece servicios en un nivel comparable a muchos de los servicios administrados de AWS
  • No hay razón para quedarse en AWS o Azure, pero como las alternativas tienen menos marketing, es difícil convencer a la dirección