- Este artículo presenta WarpStream, una plataforma de streaming de datos compatible con el protocolo de Kafka, construida directamente sobre S3.
- WarpStream se ofrece como un único binario sin estado escrito en Go, lo que elimina la necesidad de gestionar discos locales, reequilibrar brokers y operar ZooKeeper.
- La plataforma reduce de forma significativa los costos de infraestructura al transmitir datos directamente a S3, y en la nube es entre 5 y 10 veces más barata que Kafka.
- El artículo critica la idoneidad de Kafka para las cargas de trabajo modernas y destaca los altos costos de ancho de banda entre zonas de disponibilidad y la sobrecarga operativa.
- La arquitectura de WarpStream es diferente a la de Kafka. En lugar de brokers, hay "agentes" sin estado que pueden actuar como "líder" de cualquier tema, confirmar offsets para cualquier grupo de consumidores o funcionar como coordinador del clúster.
- En WarpStream, todo el almacenamiento se descarga a un almacenamiento de objetos como S3, lo que permite una escalabilidad sencilla y una recuperación rápida ante fallos.
- WarpStream separa los datos y los metadatos, y almacena los metadatos de todos los "clústeres virtuales" en una base de datos de metadatos personalizada.
- La plataforma reduce de forma importante el costo total de la mayoría de las cargas de trabajo de Kafka entre 5 y 10 veces, pero tiene una latencia más alta: un P99 de aproximadamente 400 ms para solicitudes de producción y cerca de 1 segundo del productor al consumidor.
- WarpStream se encuentra actualmente en etapa de vista previa para desarrolladores y todavía no está listo para uso en producción.
- Los creadores de WarpStream consideran que la UX para desarrolladores de Kafka es un problema, y señalan en particular la abstracción de bajo nivel de las particiones. Planean resolver esto en futuras actualizaciones de WarpStream.
- El artículo concluye invitando a los lectores a probar WarpStream y compartir su retroalimentación.
1 comentarios
Opiniones de Hacker News