- Base de datos vectorial que puede integrarse directamente dentro de la aplicación, diseñada para realizar búsquedas de similitud a gran escala con una configuración mínima
- Construida sobre el motor Proxima de Alibaba, ofrece escalabilidad de nivel de producción y rendimiento de búsqueda de baja latencia
- Compatible tanto con vectores densos (dense) como dispersos (sparse), y permite ejecutar consultas multivector en una sola llamada
- Mediante búsqueda híbrida, permite búsquedas precisas que combinan similitud semántica y filtrado estructural
- En forma de biblioteca en proceso que se ejecuta sin servidor ni proceso de configuración, puede funcionar en notebooks, servidores, CLI y entornos edge
- Compatible con Linux (x86/ARM) y macOS, y fácil de instalar en entornos Python/Node.js
- Compuesta por un motor central basado en C++ y una estructura de bindings con SWIG y Python, lo que permite operaciones de alto rendimiento e integración con varios lenguajes
- Mejora el tiempo de carga de índices y la eficiencia de memoria con optimizaciones como
unordered_map para búsqueda promedio de claves O(1)
- Usa operaciones de cuantización Int4/Int8 para mantener el equilibrio entre velocidad y precisión al procesar grandes volúmenes de vectores
- Licencia Apache-2.0
2 comentarios
Alibaba ya había sacado algo como AliSQL, un fork de MySQL que, según el post relacionado de arriba, también combina DuckDB para búsqueda vectorial, así que parece que están probando muchas cosas nuevas. QWEN también, y en la era de la IA da la impresión de que Alibaba es la empresa china que más activamente está haciendo open source.
Se ve muchísimo.