10 puntos por GN⁺ 2025-04-12 | 2 comentarios | Compartir por WhatsApp

> El "protocolo con estado de Colossus" es el ingrediente secreto detrás del alto rendimiento de Rapid Storage

  • Google Cloud Storage se usa ampliamente por su simplicidad y escalabilidad
  • Los protocolos tradicionales sin estado basados en REST son fáciles de usar, pero presentan problemas de latencia y falta de funciones centradas en archivos para cargas de trabajo de IA y de uso intensivo de datos
  • Rapid Storage resuelve este problema al introducir un protocolo de streaming gRPC con estado, manteniendo al mismo tiempo la escalabilidad y el rendimiento del almacenamiento de objetos

Fortalezas de la arquitectura basada en Colossus

  • Colossus es el sistema de archivos a nivel de clúster interno de Google, y sirve como tecnología base para productos de alto rendimiento
  • Usa un protocolo con estado para permitir lecturas y escrituras de datos con latencia ultrabaja
  • Los clientes abren un archivo y reciben un handle, con el que pueden comunicarse directamente con el disco
  • Aprovecha un protocolo similar a RDMA para acceso rápido, con optimización para SSD y técnicas de escritura en paralelo
  • Es adecuado para escrituras de logs que requieren durabilidad y para cargas de trabajo de análisis en streaming

Cómo funciona el protocolo con estado de Colossus

  • Al abrir un archivo en modo append, el Curator genera un handle y lo entrega al cliente
  • La aplicación escribe los datos de log en el cliente, y el cliente usa el handle para escribir en paralelo en varios discos
  • Para almacenar los datos de forma duradera, se replican en múltiples discos, y las escrituras basadas en quórum minimizan la latencia

Rendimiento de Rapid Storage y ejemplos de uso

  • El cliente de Cloud Storage preprocesa la autenticación y el acceso a metadatos al crear un stream gRPC
  • Después, las lecturas y escrituras se conectan directamente con Colossus, manteniendo una latencia ultrabaja
  • Puede procesar 20 millones de solicitudes por segundo por bucket — adecuado para cargas de trabajo de IA/ML a gran escala
  • Diseño optimizado para entrenamiento de IA/ML

    • Es ideal para leer de forma no secuencial grandes archivos de datos que contienen cientos de millones a miles de millones de tokens
    • Al iniciar el entrenamiento, se puede crear un stream y realizar lecturas de rango en paralelo con latencia ultrabaja
    • Durante el entrenamiento, se pueden suministrar rápidamente muestras de datos sin latencia de almacenamiento
  • Manejo de append seguro y eficiente

    • Se puede hacer append ilimitado a un solo objeto (dentro del límite de tamaño del objeto)
    • Mediante el handle, incluso si el stream se interrumpe, se puede reconectar y continuar leyendo o escribiendo
    • Solo un stream puede escribir en el objeto a la vez — un stream nuevo bloquea el stream anterior de forma transaccional
    • Cada append especifica el offset de escritura para garantizar la consistencia de los datos

Integración y API de Rapid Storage

  • Se están actualizando los SDK para admitir la función de append basada en gRPC
  • Está integrado en Cloud Storage FUSE, lo que permite acceder a los buckets de Cloud Storage como si fueran un sistema de archivos
  • También se integra con Hierarchical Namespace para reforzar el rendimiento y la consistencia, además de admitir API basadas en carpetas

Ventajas combinadas de Rapid Storage

  • Latencia ultrabaja al nivel del almacenamiento en bloques
  • Alto rendimiento al nivel de un sistema de archivos paralelo
  • Además, ofrece la escalabilidad y la simplicidad del almacenamiento de objetos

2 comentarios

 
ethanhur 2025-04-14

Dicen que Colossus es muy bueno, pero me da curiosidad saber qué opinan quienes lo han usado por dentro en la práctica.

 
GN⁺ 2025-04-12
Comentarios de Hacker News
  • Google es el único entre los principales proveedores de nube que ofrece almacenamiento de objetos de baja latencia en una sola zona, almacenamiento de objetos regional estándar y almacenamiento de objetos de doble región con replicación transparente, todo con la misma API
    • En los sistemas de infraestructura, se puede escribir código usando la API de GCS y luego dejar que el usuario elija el equilibrio entre costo, latencia y durabilidad
  • Se anunció en la conferencia Google Next 2025 y se publicó un cliente gRPC para Rapid Storage
    • Parece ser un wrapper delgado sobre el propio Colossus y es almacenamiento de una sola zona
  • Parece que realmente podría acelerar la computación científica
    • La localización/no localización de datos es una parte importante del tiempo total de ejecución de las instancias
  • Tuve que volver a ver el video clásico de microservicios
    • Estaba seguro de que usaban Colossus, pero en realidad era Galactus & Omega Star
  • Este enlace se entiende mucho mejor que el anterior
  • La alta velocidad de I/O aleatorio de los SSD contribuye enormemente a la ventaja
    • Una velocidad de escritura de 20m por segundo probablemente sea posible al distribuirla a través de la red de unidades
  • Me alegra ver que el almacenamiento de objetos de una sola zona se está consolidando con éxito
    • Un ancho de banda enorme va a redefinir el análisis de datos
    • El 99% de todas las consultas puede ejecutarse más rápido en un solo nodo que con computación distribuida
  • Me gustaría recibir Chubby como servicio
    • Podría deshacerme de etcd y zookeeper
  • Es similar a S3 express one zone
  • Me pregunto si esto está relacionado con los anywhere caches solo por invitación privada
    • O quizá ahora ya sea GA