- Base de datos de grafos de alto rendimiento desarrollada en Rust, que funciona tanto en modo embebido como en servidor y mantiene un bajo uso de memoria
- Compatible tanto con el modelo Labeled Property Graph (LPG) como con tripletas RDF, lo que permite una amplia gama de usos, desde redes sociales hasta la web semántica
- Compatible con varios lenguajes de consulta como GQL, Cypher, Gremlin, GraphQL, SPARQL y SQL/PGQ, lo que amplía las opciones para los desarrolladores
- Ofrece un conjunto completo de funciones, incluyendo búsqueda vectorial basada en HNSW, transacciones ACID, aislamiento de instantáneas con MVCC y bindings multilenguaje
- Se integra con frameworks de IA como LangChain, LlamaIndex y MCP, lo que facilita combinar datos de grafos con aplicaciones de IA
Resumen de Grafeo
- Grafeo es una base de datos de grafos de alto rendimiento desarrollada en Rust, que funciona tanto en modo embebido como en servidor y mantiene un bajo uso de memoria
- Registró el mejor rendimiento en el LDBC Social Network Benchmark y admite ejecución vectorizada, chunking adaptativo y operaciones optimizadas con SIMD
- Compatible con dos modelos de datos: Labeled Property Graph (LPG) y tripletas RDF, por lo que se adapta a diversos dominios, desde redes sociales hasta la web semántica
- Ofrece un conjunto completo de capacidades, incluyendo transacciones ACID, aislamiento de instantáneas basado en MVCC, bindings multilenguaje y un ecosistema de integración con IA
Características principales
-
Arquitectura de alto rendimiento
- Escrito con un motor central basado en Rust, sin dependencias de C, aunque opcionalmente puede usar jemalloc/mimalloc y bibliotecas C para TLS
- Incluye motor de ejecución basado en push, procesamiento paralelo por morsels, almacenamiento columnar, compresión por tipo y optimizador de consultas basado en costos
- También permite consultas eficientes mediante omisión de datos usando zone maps
-
Compatibilidad con múltiples lenguajes de consulta
- Compatible con GQL, Cypher, Gremlin, GraphQL, SPARQL y SQL/PGQ
- Permite elegir el lenguaje más adecuado según la naturaleza del proyecto y el nivel de experiencia del desarrollador
- GQL ofrece pattern matching declarativo estándar ISO; Cypher usa patrones ASCII-art compatibles con Neo4j; Gremlin adopta un estilo de recorrido basado en Apache TinkerPop
- GraphQL es compatible tanto con LPG como con RDF; SPARQL es el lenguaje estándar de consulta RDF de W3C; SQL/PGQ admite la sintaxis
GRAPH_TABLE de SQL:2023
-
Modelos de datos
- El modelo LPG utiliza una estructura de nodos y aristas con etiquetas y propiedades, y admite propiedades de diversos tipos de datos
- El modelo RDF utiliza una estructura de tripletas subject-predicate-object y permite consultas eficientes mediante índices SPO/POS/OSP
- RDF cumple con los estándares de W3C, por lo que es adecuado para web semántica, ontologías y linked data
-
Funciones de búsqueda vectorial
- Proporciona búsqueda de similitud basada en HNSW y admite cuantización escalar, binaria y por producto
- Permite combinar la exploración de grafos con búsqueda de similitud semántica
-
Embebido y ejecución independiente
- Puede integrarse directamente en aplicaciones sin dependencias externas o ejecutarse como servidor independiente con REST API y web UI
- Escala desde dispositivos edge hasta clústeres de producción a gran escala
-
Transacciones y seguridad de memoria
- Garantiza transacciones ACID completas mediante aislamiento de instantáneas basado en MVCC
- Gracias a la seguridad de memoria de Rust y al diseño de fearless concurrency, ofrece manejo concurrente estable
-
Bindings multilenguaje
- Compatible con Python (PyO3), Node.js/TypeScript (napi-rs), Go (CGO), C (FFI), C# (.NET 8 P/Invoke), Dart (dart:ffi) y WebAssembly (wasm-bindgen)
- Permite aprovechar el mismo motor de Grafeo en distintos entornos de programación
-
Ecosistema e integraciones
- Se integra con frameworks de IA como LangChain, LlamaIndex y MCP
- También ofrece widgets interactivos para notebooks, visualización de grafos en WebAssembly desde el navegador, servidor independiente con web UI y herramientas de benchmarking
Instalación e inicio
-
Comandos de instalación
- Python:
uv add grafeo
- Node.js:
npm install @grafeo-db/js
- Go:
go get github.com/GrafeoDB/grafeo/crates/bindings/go
- Rust:
cargo add grafeo
- .NET:
dotnet add package GrafeoDB
- Dart:
grafeo: ^0.5.21
- WebAssembly:
npm install @grafeo-db/wasm
-
Ejemplo de inicio rápido
- En el ejemplo de Python, después de crear una base de datos en memoria, se agregan nodos y aristas con las sentencias
INSERT y MATCH, y se consultan relaciones
- En el ejemplo de Rust, se crea la base de datos con
GrafeoDB::new_in_memory() y se ejecutan las mismas consultas a través de una sesión
Licencia
- Grafeo se distribuye bajo la licencia Apache-2.0
1 comentarios
Comentarios en Hacker News
Me pregunto si Grafeo implementó el benchmark LDBC
Me gustaría compararlo con otras bases de datos de grafos. En especial, me interesa el rendimiento en consultas OLAP
Artículo relacionado: Neo4j alternatives in 2026
Hace poco publicamos una sintaxis Cypher para gfql
Es el primer motor de consultas Cypher OSS basado en CPU/GPU que puede ejecutarse directamente sobre dataframes
Se usa sobre todo junto con bases de datos escalables como Databricks o Splunk para seguridad, detección de fraude, análisis de eventos y pipelines de embeddings de ML+AI
Puede procesar más de mil millones de edges por segundo con una sola GPU sin instalar una DB, y también aplicarse directamente sobre datos Apache Arrow o Parquet
Consulten la documentación de benchmarks de GFQL
El núcleo vectorizado ya cumple con más de la mitad del TCK, y ahora estamos agregando las partes más complejas
Ya se usa en producción en instituciones como la OTAN, bancos y el gobierno de EE. UU., y ahora lo liberamos como open source para que otros desarrolladores o LLM puedan usarlo directamente
Me pregunto si alguien conoce esta DB (Grafeo)
Viendo el historial de commits, parece casi un proyecto escrito por IA. Una sola persona hizo commits de 100 mil a 200 mil líneas por semana
En casos así, muchas veces la calidad del código es débil o está excesivamente complejizado
Quisiera saber si alguien realmente lo usa, o si es solo un experimento de portafolio con IA
La versión inicial es una reconstrucción de una DB de grafos local que hice yo mismo llamada Graphos
El motor, el core, los bindings de Python y las pruebas fueron escritos manualmente, y la documentación junto con parte de la configuración fueron generadas con IA
Revisé las partes hechas por IA, pero todavía no están al nivel de producción
Empecé inspirado por mi frustración con Neo4j y por una conversación con Hännes de DuckDB
Como el uso de memoria de LadybugDB era demasiado alto, intenté hacer la mía, y por ahora la uso personalmente con satisfacción
No tiene un objetivo comercial, la publiqué como open source y doy la bienvenida a quienes quieran contribuir
En un motor de grafos el diseño fino es importante, así que me preocupa la calidad del diseño en los detalles
Incluso en gdotv.com, que yo opero, cada vez es más difícil decidir cuáles soportar
Hay tantas graph DB que me confundí y por eso hice el nuevo sitio gdb-engines.com
Clasifica y organiza cada DB
Me pregunto si existe alguna graph DB realmente confiable a escala de producción
Quisiera saberlo entre open source o productos de vendors, excluyendo casos especiales como TAO de Meta
Trato este tema en mi charla de FOSDEM 2025
La mayoría de las DB OSS siguen en cierta medida un modelo open-core
Artículo relacionado: A brief history of graphs at Facebook
En especial, hay tecnologías como JanusGraph que, aunque son antiguas, siguen usándose de forma constante en empresas
Ahora mismo hay 25 graph DB que se subieron a la ola del boom de AI/LLM
Si están escritas en Rust llaman la atención en HN, pero LadybugDB decidió no ir por ahí
En cambio, quiere enfocarse en la mejora gradual y en un único Cypher fuertemente tipado
Discusión relacionada: LadybugDB Discussion #141
Hay que evaluarlo con fundamento técnico, no como una simple “emoción”
Grafeo definitivamente es un proyecto escrito con ayuda de IA
Tiene mucho código, pero no parece una simple generación automática de IA, y el diseño también es particular
Las pruebas en JS sí parecen totalmente generadas por IA, y la calidad de algunos subrepositorios es irregular
La licencia Apache 2.0 y las funcionalidades son interesantes, pero parece necesitar más maintainers
Me pregunto cuál es la diferencia frente a Helix DB
Y también dudo de por qué habría que consultar la DB con GraphQL
La frase “se probó el benchmark LDBC con graph-bench” suena como si fuera un benchmark independiente
Si es una herramienta hecha por ustedes, sería mejor aclararlo y recibir feedback para poder comparar justamente también con otros proyectos
Es un patrón típico de los codebases generados por IA que últimamente aparecen seguido en HN
Si hay más de 100 mil líneas por semana en commits, es poco probable que una persona realmente entienda bien el contenido del código
Probé Grafeo y la librería relacionada grafeo_langchain junto con un modelo local de Ollama
El resultado fue un éxito a medias
Aun así, sigo prefiriendo y usando la graph DB Kuzu basada en Python
Kuzu ya no se desarrolla más, pero como es estable se sigue manteniendo el soporte
También vale la pena considerar la migración a LadybugDB (fork principal), ya que es sencilla