Colossus para almacenamiento rápido

(cloud.google.com)

10 puntos por GN⁺ 2025-04-12 | 2 comentarios | Compartir por WhatsApp

El "protocolo con estado de Colossus" es el ingrediente secreto detrás del alto rendimiento de Rapid Storage

Google Cloud Storage se usa ampliamente por su simplicidad y escalabilidad
Los protocolos tradicionales sin estado basados en REST son fáciles de usar, pero presentan problemas de latencia y falta de funciones centradas en archivos para cargas de trabajo de IA y de uso intensivo de datos
Rapid Storage resuelve este problema al introducir un protocolo de streaming gRPC con estado, manteniendo al mismo tiempo la escalabilidad y el rendimiento del almacenamiento de objetos

Fortalezas de la arquitectura basada en Colossus

Colossus es el sistema de archivos a nivel de clúster interno de Google, y sirve como tecnología base para productos de alto rendimiento
Usa un protocolo con estado para permitir lecturas y escrituras de datos con latencia ultrabaja
Los clientes abren un archivo y reciben un handle, con el que pueden comunicarse directamente con el disco
Aprovecha un protocolo similar a RDMA para acceso rápido, con optimización para SSD y técnicas de escritura en paralelo
Es adecuado para escrituras de logs que requieren durabilidad y para cargas de trabajo de análisis en streaming

Cómo funciona el protocolo con estado de Colossus

Al abrir un archivo en modo append, el Curator genera un handle y lo entrega al cliente
La aplicación escribe los datos de log en el cliente, y el cliente usa el handle para escribir en paralelo en varios discos
Para almacenar los datos de forma duradera, se replican en múltiples discos, y las escrituras basadas en quórum minimizan la latencia

Rendimiento de Rapid Storage y ejemplos de uso

El cliente de Cloud Storage preprocesa la autenticación y el acceso a metadatos al crear un stream gRPC
Después, las lecturas y escrituras se conectan directamente con Colossus, manteniendo una latencia ultrabaja
Puede procesar 20 millones de solicitudes por segundo por bucket — adecuado para cargas de trabajo de IA/ML a gran escala
Diseño optimizado para entrenamiento de IA/ML
- Es ideal para leer de forma no secuencial grandes archivos de datos que contienen cientos de millones a miles de millones de tokens
- Al iniciar el entrenamiento, se puede crear un stream y realizar lecturas de rango en paralelo con latencia ultrabaja
- Durante el entrenamiento, se pueden suministrar rápidamente muestras de datos sin latencia de almacenamiento
Manejo de append seguro y eficiente
- Se puede hacer append ilimitado a un solo objeto (dentro del límite de tamaño del objeto)
- Mediante el handle, incluso si el stream se interrumpe, se puede reconectar y continuar leyendo o escribiendo
- Solo un stream puede escribir en el objeto a la vez — un stream nuevo bloquea el stream anterior de forma transaccional
- Cada append especifica el offset de escritura para garantizar la consistencia de los datos

Integración y API de Rapid Storage

Se están actualizando los SDK para admitir la función de append basada en gRPC
Está integrado en Cloud Storage FUSE, lo que permite acceder a los buckets de Cloud Storage como si fueran un sistema de archivos
También se integra con Hierarchical Namespace para reforzar el rendimiento y la consistencia, además de admitir API basadas en carpetas

Ventajas combinadas de Rapid Storage

Latencia ultrabaja al nivel del almacenamiento en bloques
Alto rendimiento al nivel de un sistema de archivos paralelo
Además, ofrece la escalabilidad y la simplicidad del almacenamiento de objetos

2 comentarios

ethanhur 2025-04-14

Dicen que Colossus es muy bueno, pero me da curiosidad saber qué opinan quienes lo han usado por dentro en la práctica.

GN⁺ 2025-04-12

Comentarios de Hacker News

Google es el único entre los principales proveedores de nube que ofrece almacenamiento de objetos de baja latencia en una sola zona, almacenamiento de objetos regional estándar y almacenamiento de objetos de doble región con replicación transparente, todo con la misma API
- En los sistemas de infraestructura, se puede escribir código usando la API de GCS y luego dejar que el usuario elija el equilibrio entre costo, latencia y durabilidad
Se anunció en la conferencia Google Next 2025 y se publicó un cliente gRPC para Rapid Storage
- Parece ser un wrapper delgado sobre el propio Colossus y es almacenamiento de una sola zona
Parece que realmente podría acelerar la computación científica
- La localización/no localización de datos es una parte importante del tiempo total de ejecución de las instancias
Tuve que volver a ver el video clásico de microservicios
- Estaba seguro de que usaban Colossus, pero en realidad era Galactus & Omega Star
Este enlace se entiende mucho mejor que el anterior
La alta velocidad de I/O aleatorio de los SSD contribuye enormemente a la ventaja
- Una velocidad de escritura de 20m por segundo probablemente sea posible al distribuirla a través de la red de unidades
Me alegra ver que el almacenamiento de objetos de una sola zona se está consolidando con éxito
- Un ancho de banda enorme va a redefinir el análisis de datos
- El 99% de todas las consultas puede ejecutarse más rápido en un solo nodo que con computación distribuida
Me gustaría recibir Chubby como servicio
- Podría deshacerme de etcd y zookeeper
Es similar a S3 express one zone
Me pregunto si esto está relacionado con los anywhere caches solo por invitación privada
- O quizá ahora ya sea GA