2 puntos por GN⁺ 2026-03-23 | 1 comentarios | Compartir por WhatsApp
  • Base de datos de grafos de alto rendimiento desarrollada en Rust, que funciona tanto en modo embebido como en servidor y mantiene un bajo uso de memoria
  • Compatible tanto con el modelo Labeled Property Graph (LPG) como con tripletas RDF, lo que permite una amplia gama de usos, desde redes sociales hasta la web semántica
  • Compatible con varios lenguajes de consulta como GQL, Cypher, Gremlin, GraphQL, SPARQL y SQL/PGQ, lo que amplía las opciones para los desarrolladores
  • Ofrece un conjunto completo de funciones, incluyendo búsqueda vectorial basada en HNSW, transacciones ACID, aislamiento de instantáneas con MVCC y bindings multilenguaje
  • Se integra con frameworks de IA como LangChain, LlamaIndex y MCP, lo que facilita combinar datos de grafos con aplicaciones de IA

Resumen de Grafeo

  • Grafeo es una base de datos de grafos de alto rendimiento desarrollada en Rust, que funciona tanto en modo embebido como en servidor y mantiene un bajo uso de memoria
  • Registró el mejor rendimiento en el LDBC Social Network Benchmark y admite ejecución vectorizada, chunking adaptativo y operaciones optimizadas con SIMD
  • Compatible con dos modelos de datos: Labeled Property Graph (LPG) y tripletas RDF, por lo que se adapta a diversos dominios, desde redes sociales hasta la web semántica
  • Ofrece un conjunto completo de capacidades, incluyendo transacciones ACID, aislamiento de instantáneas basado en MVCC, bindings multilenguaje y un ecosistema de integración con IA

Características principales

  • Arquitectura de alto rendimiento

    • Escrito con un motor central basado en Rust, sin dependencias de C, aunque opcionalmente puede usar jemalloc/mimalloc y bibliotecas C para TLS
    • Incluye motor de ejecución basado en push, procesamiento paralelo por morsels, almacenamiento columnar, compresión por tipo y optimizador de consultas basado en costos
    • También permite consultas eficientes mediante omisión de datos usando zone maps
  • Compatibilidad con múltiples lenguajes de consulta

    • Compatible con GQL, Cypher, Gremlin, GraphQL, SPARQL y SQL/PGQ
    • Permite elegir el lenguaje más adecuado según la naturaleza del proyecto y el nivel de experiencia del desarrollador
    • GQL ofrece pattern matching declarativo estándar ISO; Cypher usa patrones ASCII-art compatibles con Neo4j; Gremlin adopta un estilo de recorrido basado en Apache TinkerPop
    • GraphQL es compatible tanto con LPG como con RDF; SPARQL es el lenguaje estándar de consulta RDF de W3C; SQL/PGQ admite la sintaxis GRAPH_TABLE de SQL:2023
  • Modelos de datos

    • El modelo LPG utiliza una estructura de nodos y aristas con etiquetas y propiedades, y admite propiedades de diversos tipos de datos
    • El modelo RDF utiliza una estructura de tripletas subject-predicate-object y permite consultas eficientes mediante índices SPO/POS/OSP
    • RDF cumple con los estándares de W3C, por lo que es adecuado para web semántica, ontologías y linked data
  • Funciones de búsqueda vectorial

    • Proporciona búsqueda de similitud basada en HNSW y admite cuantización escalar, binaria y por producto
    • Permite combinar la exploración de grafos con búsqueda de similitud semántica
  • Embebido y ejecución independiente

    • Puede integrarse directamente en aplicaciones sin dependencias externas o ejecutarse como servidor independiente con REST API y web UI
    • Escala desde dispositivos edge hasta clústeres de producción a gran escala
  • Transacciones y seguridad de memoria

    • Garantiza transacciones ACID completas mediante aislamiento de instantáneas basado en MVCC
    • Gracias a la seguridad de memoria de Rust y al diseño de fearless concurrency, ofrece manejo concurrente estable
  • Bindings multilenguaje

    • Compatible con Python (PyO3), Node.js/TypeScript (napi-rs), Go (CGO), C (FFI), C# (.NET 8 P/Invoke), Dart (dart:ffi) y WebAssembly (wasm-bindgen)
    • Permite aprovechar el mismo motor de Grafeo en distintos entornos de programación
  • Ecosistema e integraciones

    • Se integra con frameworks de IA como LangChain, LlamaIndex y MCP
    • También ofrece widgets interactivos para notebooks, visualización de grafos en WebAssembly desde el navegador, servidor independiente con web UI y herramientas de benchmarking

Instalación e inicio

  • Comandos de instalación

    • Python: uv add grafeo
    • Node.js: npm install @grafeo-db/js
    • Go: go get github.com/GrafeoDB/grafeo/crates/bindings/go
    • Rust: cargo add grafeo
    • .NET: dotnet add package GrafeoDB
    • Dart: grafeo: ^0.5.21
    • WebAssembly: npm install @grafeo-db/wasm
  • Ejemplo de inicio rápido

    • En el ejemplo de Python, después de crear una base de datos en memoria, se agregan nodos y aristas con las sentencias INSERT y MATCH, y se consultan relaciones
    • En el ejemplo de Rust, se crea la base de datos con GrafeoDB::new_in_memory() y se ejecutan las mismas consultas a través de una sesión

Licencia

  • Grafeo se distribuye bajo la licencia Apache-2.0

1 comentarios

 
GN⁺ 2026-03-23
Comentarios en Hacker News
  • Me pregunto si Grafeo implementó el benchmark LDBC
    Me gustaría compararlo con otras bases de datos de grafos. En especial, me interesa el rendimiento en consultas OLAP
    Artículo relacionado: Neo4j alternatives in 2026

  • Hace poco publicamos una sintaxis Cypher para gfql
    Es el primer motor de consultas Cypher OSS basado en CPU/GPU que puede ejecutarse directamente sobre dataframes
    Se usa sobre todo junto con bases de datos escalables como Databricks o Splunk para seguridad, detección de fraude, análisis de eventos y pipelines de embeddings de ML+AI
    Puede procesar más de mil millones de edges por segundo con una sola GPU sin instalar una DB, y también aplicarse directamente sobre datos Apache Arrow o Parquet
    Consulten la documentación de benchmarks de GFQL
    El núcleo vectorizado ya cumple con más de la mitad del TCK, y ahora estamos agregando las partes más complejas
    Ya se usa en producción en instituciones como la OTAN, bancos y el gobierno de EE. UU., y ahora lo liberamos como open source para que otros desarrolladores o LLM puedan usarlo directamente

  • Me pregunto si alguien conoce esta DB (Grafeo)
    Viendo el historial de commits, parece casi un proyecto escrito por IA. Una sola persona hizo commits de 100 mil a 200 mil líneas por semana
    En casos así, muchas veces la calidad del código es débil o está excesivamente complejizado
    Quisiera saber si alguien realmente lo usa, o si es solo un experimento de portafolio con IA

    • Yo soy precisamente la persona que creó Grafeo. No sé por qué se está difundiendo por todos lados, pero puedo responder preguntas
      La versión inicial es una reconstrucción de una DB de grafos local que hice yo mismo llamada Graphos
      El motor, el core, los bindings de Python y las pruebas fueron escritos manualmente, y la documentación junto con parte de la configuración fueron generadas con IA
      Revisé las partes hechas por IA, pero todavía no están al nivel de producción
      Empecé inspirado por mi frustración con Neo4j y por una conversación con Hännes de DuckDB
      Como el uso de memoria de LadybugDB era demasiado alto, intenté hacer la mía, y por ahora la uso personalmente con satisfacción
      No tiene un objetivo comercial, la publiqué como open source y doy la bienvenida a quienes quieran contribuir
    • Esa cantidad de código es mucha incluso para la estructura típica de una graph DB
      En un motor de grafos el diseño fino es importante, así que me preocupa la calidad del diseño en los detalles
    • Usar una DB escrita por un LLM suena a pesadilla. Incluso las DB grandes ya son difíciles de manejar
    • En los últimos 3 meses hubo una explosión de graph DB creadas por LLM
      Incluso en gdotv.com, que yo opero, cada vez es más difícil decidir cuáles soportar
    • Hacer commits de 100 mil líneas por semana es una señal de alerta. Lo más probable es que sea código generado o formateado, y la confiabilidad del diseño o de las pruebas puede ser baja
  • Hay tantas graph DB que me confundí y por eso hice el nuevo sitio gdb-engines.com
    Clasifica y organiza cada DB

    • Estaría bien que en la tabla hubiera una distinción entre embebida o de servidor
    • Me pregunto si esta lista no fue generada con LLM
  • Me pregunto si existe alguna graph DB realmente confiable a escala de producción
    Quisiera saberlo entre open source o productos de vendors, excluyendo casos especiales como TAO de Meta

    • Preferiría evitar una respuesta directa, pero elegir una graph DB realmente es un problema difícil
      Trato este tema en mi charla de FOSDEM 2025
    • Tomando como referencia open source, JanusGraph, DGraph, Apache AGE, HugeGraph, MemGraph y ArcadeDB son opciones adecuadas
    • Yo lidero el desarrollo de TypeDB. No usa Cypher, pero funciona bien incluso en producción a gran escala
      La mayoría de las DB OSS siguen en cierta medida un modelo open-core
    • El sistema de grafos de Facebook no es solo TAO, sino un ecosistema más grande
      Artículo relacionado: A brief history of graphs at Facebook
    • He integrado decenas de graph DB en gdotv.com, y la mayoría están a nivel de producción
      En especial, hay tecnologías como JanusGraph que, aunque son antiguas, siguen usándose de forma constante en empresas
  • Ahora mismo hay 25 graph DB que se subieron a la ola del boom de AI/LLM
    Si están escritas en Rust llaman la atención en HN, pero LadybugDB decidió no ir por ahí
    En cambio, quiere enfocarse en la mejora gradual y en un único Cypher fuertemente tipado
    Discusión relacionada: LadybugDB Discussion #141

    • Me pregunto si LadybugDB no es también uno de esos 25 proyectos
    • Es una buena decisión en el sentido de que lo que genera clientes es el grado de madurez del producto, más que el lenguaje
    • El debate sobre lenguajes cansa, pero Rust sí tiene ventajas reales en desarrollo de DB en términos de concurrencia y prevención de corrupción de datos
      Hay que evaluarlo con fundamento técnico, no como una simple “emoción”
  • Grafeo definitivamente es un proyecto escrito con ayuda de IA
    Tiene mucho código, pero no parece una simple generación automática de IA, y el diseño también es particular
    Las pruebas en JS sí parecen totalmente generadas por IA, y la calidad de algunos subrepositorios es irregular
    La licencia Apache 2.0 y las funcionalidades son interesantes, pero parece necesitar más maintainers

  • Me pregunto cuál es la diferencia frente a Helix DB
    Y también dudo de por qué habría que consultar la DB con GraphQL

  • La frase “se probó el benchmark LDBC con graph-bench” suena como si fuera un benchmark independiente
    Si es una herramienta hecha por ustedes, sería mejor aclararlo y recibir feedback para poder comparar justamente también con otros proyectos

    • Probablemente esa frase también fue escrita automáticamente por IA
      Es un patrón típico de los codebases generados por IA que últimamente aparecen seguido en HN
      Si hay más de 100 mil líneas por semana en commits, es poco probable que una persona realmente entienda bien el contenido del código
  • Probé Grafeo y la librería relacionada grafeo_langchain junto con un modelo local de Ollama
    El resultado fue un éxito a medias
    Aun así, sigo prefiriendo y usando la graph DB Kuzu basada en Python

    • Me pregunto si probaron Kuzu en gdotv.com
      Kuzu ya no se desarrolla más, pero como es estable se sigue manteniendo el soporte
      También vale la pena considerar la migración a LadybugDB (fork principal), ya que es sencilla