Grafeo – base de datos de grafos embebida, rápida y ligera

(grafeo.dev)

2 puntos por GN⁺ 2026-03-23 | 1 comentarios | Compartir por WhatsApp

Base de datos de grafos de alto rendimiento desarrollada en Rust, que funciona tanto en modo embebido como en servidor y mantiene un bajo uso de memoria
Compatible tanto con el modelo Labeled Property Graph (LPG) como con tripletas RDF, lo que permite una amplia gama de usos, desde redes sociales hasta la web semántica
Compatible con varios lenguajes de consulta como GQL, Cypher, Gremlin, GraphQL, SPARQL y SQL/PGQ, lo que amplía las opciones para los desarrolladores
Ofrece un conjunto completo de funciones, incluyendo búsqueda vectorial basada en HNSW, transacciones ACID, aislamiento de instantáneas con MVCC y bindings multilenguaje
Se integra con frameworks de IA como LangChain, LlamaIndex y MCP, lo que facilita combinar datos de grafos con aplicaciones de IA

Resumen de Grafeo

Grafeo es una base de datos de grafos de alto rendimiento desarrollada en Rust, que funciona tanto en modo embebido como en servidor y mantiene un bajo uso de memoria
Registró el mejor rendimiento en el LDBC Social Network Benchmark y admite ejecución vectorizada, chunking adaptativo y operaciones optimizadas con SIMD
Compatible con dos modelos de datos: Labeled Property Graph (LPG) y tripletas RDF, por lo que se adapta a diversos dominios, desde redes sociales hasta la web semántica
Ofrece un conjunto completo de capacidades, incluyendo transacciones ACID, aislamiento de instantáneas basado en MVCC, bindings multilenguaje y un ecosistema de integración con IA

Características principales

Arquitectura de alto rendimiento
- Escrito con un motor central basado en Rust, sin dependencias de C, aunque opcionalmente puede usar jemalloc/mimalloc y bibliotecas C para TLS
- Incluye motor de ejecución basado en push, procesamiento paralelo por morsels, almacenamiento columnar, compresión por tipo y optimizador de consultas basado en costos
- También permite consultas eficientes mediante omisión de datos usando zone maps
Compatibilidad con múltiples lenguajes de consulta
- Compatible con GQL, Cypher, Gremlin, GraphQL, SPARQL y SQL/PGQ
- Permite elegir el lenguaje más adecuado según la naturaleza del proyecto y el nivel de experiencia del desarrollador
- GQL ofrece pattern matching declarativo estándar ISO; Cypher usa patrones ASCII-art compatibles con Neo4j; Gremlin adopta un estilo de recorrido basado en Apache TinkerPop
- GraphQL es compatible tanto con LPG como con RDF; SPARQL es el lenguaje estándar de consulta RDF de W3C; SQL/PGQ admite la sintaxis GRAPH_TABLE de SQL:2023
Modelos de datos
- El modelo LPG utiliza una estructura de nodos y aristas con etiquetas y propiedades, y admite propiedades de diversos tipos de datos
- El modelo RDF utiliza una estructura de tripletas subject-predicate-object y permite consultas eficientes mediante índices SPO/POS/OSP
- RDF cumple con los estándares de W3C, por lo que es adecuado para web semántica, ontologías y linked data
Funciones de búsqueda vectorial
- Proporciona búsqueda de similitud basada en HNSW y admite cuantización escalar, binaria y por producto
- Permite combinar la exploración de grafos con búsqueda de similitud semántica
Embebido y ejecución independiente
- Puede integrarse directamente en aplicaciones sin dependencias externas o ejecutarse como servidor independiente con REST API y web UI
- Escala desde dispositivos edge hasta clústeres de producción a gran escala
Transacciones y seguridad de memoria
- Garantiza transacciones ACID completas mediante aislamiento de instantáneas basado en MVCC
- Gracias a la seguridad de memoria de Rust y al diseño de fearless concurrency, ofrece manejo concurrente estable
Bindings multilenguaje
- Compatible con Python (PyO3), Node.js/TypeScript (napi-rs), Go (CGO), C (FFI), C# (.NET 8 P/Invoke), Dart (dart:ffi) y WebAssembly (wasm-bindgen)
- Permite aprovechar el mismo motor de Grafeo en distintos entornos de programación
Ecosistema e integraciones
- Se integra con frameworks de IA como LangChain, LlamaIndex y MCP
- También ofrece widgets interactivos para notebooks, visualización de grafos en WebAssembly desde el navegador, servidor independiente con web UI y herramientas de benchmarking

Instalación e inicio

Comandos de instalación
- Python: uv add grafeo
- Node.js: npm install @grafeo-db/js
- Go: go get github.com/GrafeoDB/grafeo/crates/bindings/go
- Rust: cargo add grafeo
- .NET: dotnet add package GrafeoDB
- Dart: grafeo: ^0.5.21
- WebAssembly: npm install @grafeo-db/wasm
Ejemplo de inicio rápido
- En el ejemplo de Python, después de crear una base de datos en memoria, se agregan nodos y aristas con las sentencias INSERT y MATCH, y se consultan relaciones
- En el ejemplo de Rust, se crea la base de datos con GrafeoDB::new_in_memory() y se ejecutan las mismas consultas a través de una sesión

Licencia

Grafeo se distribuye bajo la licencia Apache-2.0

1 comentarios

GN⁺ 2026-03-23

Comentarios en Hacker News

Me pregunto si Grafeo implementó el benchmark LDBC
Me gustaría compararlo con otras bases de datos de grafos. En especial, me interesa el rendimiento en consultas OLAP
Artículo relacionado: Neo4j alternatives in 2026
Hace poco publicamos una sintaxis Cypher para gfql
Es el primer motor de consultas Cypher OSS basado en CPU/GPU que puede ejecutarse directamente sobre dataframes
Se usa sobre todo junto con bases de datos escalables como Databricks o Splunk para seguridad, detección de fraude, análisis de eventos y pipelines de embeddings de ML+AI
Puede procesar más de mil millones de edges por segundo con una sola GPU sin instalar una DB, y también aplicarse directamente sobre datos Apache Arrow o Parquet
Consulten la documentación de benchmarks de GFQL
El núcleo vectorizado ya cumple con más de la mitad del TCK, y ahora estamos agregando las partes más complejas
Ya se usa en producción en instituciones como la OTAN, bancos y el gobierno de EE. UU., y ahora lo liberamos como open source para que otros desarrolladores o LLM puedan usarlo directamente
Me pregunto si alguien conoce esta DB (Grafeo)
Viendo el historial de commits, parece casi un proyecto escrito por IA. Una sola persona hizo commits de 100 mil a 200 mil líneas por semana
En casos así, muchas veces la calidad del código es débil o está excesivamente complejizado
Quisiera saber si alguien realmente lo usa, o si es solo un experimento de portafolio con IA
- Yo soy precisamente la persona que creó Grafeo. No sé por qué se está difundiendo por todos lados, pero puedo responder preguntas
  La versión inicial es una reconstrucción de una DB de grafos local que hice yo mismo llamada Graphos
  El motor, el core, los bindings de Python y las pruebas fueron escritos manualmente, y la documentación junto con parte de la configuración fueron generadas con IA
  Revisé las partes hechas por IA, pero todavía no están al nivel de producción
  Empecé inspirado por mi frustración con Neo4j y por una conversación con Hännes de DuckDB
  Como el uso de memoria de LadybugDB era demasiado alto, intenté hacer la mía, y por ahora la uso personalmente con satisfacción
  No tiene un objetivo comercial, la publiqué como open source y doy la bienvenida a quienes quieran contribuir
- Esa cantidad de código es mucha incluso para la estructura típica de una graph DB
  En un motor de grafos el diseño fino es importante, así que me preocupa la calidad del diseño en los detalles
- Usar una DB escrita por un LLM suena a pesadilla. Incluso las DB grandes ya son difíciles de manejar
- En los últimos 3 meses hubo una explosión de graph DB creadas por LLM
  Incluso en gdotv.com, que yo opero, cada vez es más difícil decidir cuáles soportar
- Hacer commits de 100 mil líneas por semana es una señal de alerta. Lo más probable es que sea código generado o formateado, y la confiabilidad del diseño o de las pruebas puede ser baja
Hay tantas graph DB que me confundí y por eso hice el nuevo sitio gdb-engines.com
Clasifica y organiza cada DB
- Estaría bien que en la tabla hubiera una distinción entre embebida o de servidor
- Me pregunto si esta lista no fue generada con LLM
Me pregunto si existe alguna graph DB realmente confiable a escala de producción
Quisiera saberlo entre open source o productos de vendors, excluyendo casos especiales como TAO de Meta
- Preferiría evitar una respuesta directa, pero elegir una graph DB realmente es un problema difícil
  Trato este tema en mi charla de FOSDEM 2025
- Tomando como referencia open source, JanusGraph, DGraph, Apache AGE, HugeGraph, MemGraph y ArcadeDB son opciones adecuadas
- Yo lidero el desarrollo de TypeDB. No usa Cypher, pero funciona bien incluso en producción a gran escala
  La mayoría de las DB OSS siguen en cierta medida un modelo open-core
- El sistema de grafos de Facebook no es solo TAO, sino un ecosistema más grande
  Artículo relacionado: A brief history of graphs at Facebook
- He integrado decenas de graph DB en gdotv.com, y la mayoría están a nivel de producción
  En especial, hay tecnologías como JanusGraph que, aunque son antiguas, siguen usándose de forma constante en empresas
Ahora mismo hay 25 graph DB que se subieron a la ola del boom de AI/LLM
Si están escritas en Rust llaman la atención en HN, pero LadybugDB decidió no ir por ahí
En cambio, quiere enfocarse en la mejora gradual y en un único Cypher fuertemente tipado
Discusión relacionada: LadybugDB Discussion #141
- Me pregunto si LadybugDB no es también uno de esos 25 proyectos
- Es una buena decisión en el sentido de que lo que genera clientes es el grado de madurez del producto, más que el lenguaje
- El debate sobre lenguajes cansa, pero Rust sí tiene ventajas reales en desarrollo de DB en términos de concurrencia y prevención de corrupción de datos
  Hay que evaluarlo con fundamento técnico, no como una simple “emoción”
Grafeo definitivamente es un proyecto escrito con ayuda de IA
Tiene mucho código, pero no parece una simple generación automática de IA, y el diseño también es particular
Las pruebas en JS sí parecen totalmente generadas por IA, y la calidad de algunos subrepositorios es irregular
La licencia Apache 2.0 y las funcionalidades son interesantes, pero parece necesitar más maintainers
Me pregunto cuál es la diferencia frente a Helix DB
Y también dudo de por qué habría que consultar la DB con GraphQL
La frase “se probó el benchmark LDBC con graph-bench” suena como si fuera un benchmark independiente
Si es una herramienta hecha por ustedes, sería mejor aclararlo y recibir feedback para poder comparar justamente también con otros proyectos
- Probablemente esa frase también fue escrita automáticamente por IA
  Es un patrón típico de los codebases generados por IA que últimamente aparecen seguido en HN
  Si hay más de 100 mil líneas por semana en commits, es poco probable que una persona realmente entienda bien el contenido del código
Probé Grafeo y la librería relacionada grafeo_langchain junto con un modelo local de Ollama
El resultado fue un éxito a medias
Aun así, sigo prefiriendo y usando la graph DB Kuzu basada en Python
- Me pregunto si probaron Kuzu en gdotv.com
  Kuzu ya no se desarrolla más, pero como es estable se sigue manteniendo el soporte
  También vale la pena considerar la migración a LadybugDB (fork principal), ya que es sencilla

Grafeo – base de datos de grafos embebida, rápida y ligera

Resumen de Grafeo

Características principales

Arquitectura de alto rendimiento

Compatibilidad con múltiples lenguajes de consulta

Modelos de datos

Funciones de búsqueda vectorial

Embebido y ejecución independiente

Transacciones y seguridad de memoria

Bindings multilenguaje

Ecosistema e integraciones

Instalación e inicio

Comandos de instalación

Ejemplo de inicio rápido

Licencia

Lecturas relacionadas

1 comentarios

Comentarios en Hacker News