3 puntos por GN⁺ 2023-10-05 | 1 comentarios | Compartir por WhatsApp
  • El texto analiza Graph Mining Library, un proyecto que incluye herramientas desarrolladas por el equipo de Graph Mining de Google.
  • Estas herramientas fueron diseñadas para resolver problemas de minería de datos y aprendizaje automático que tienen inherentemente una estructura de grafo o que pueden formalizarse como problemas de grafos.
  • Esta biblioteca incluye algoritmos de clustering paralelo en memoria compartida capaces de procesar grafos con decenas de miles de millones de aristas.
  • Estos algoritmos se basan en varios artículos de investigación, entre ellos "Hierarchical Agglomerative Graph Clustering at Poly-Logarithmic Depth", "Scalable community detection via parallel correlation clustering", "Affinity Clustering: Hierarchical Clustering at Scale" y "Distributed Balanced Partitioning via Linear Embedding".
  • Se proporcionan enlaces a secciones específicas del repositorio relacionadas con cada artículo.
  • Si hay preguntas o comentarios, se recomienda a los usuarios crear un issue en el repositorio.
  • El texto también ofrece una guía de inicio rápido que explica cómo instalar Bazel y ejecutar ejemplos.

1 comentarios

 
GN⁺ 2023-10-05
Comentarios de Hacker News
  • Con el auge de las redes sociales, la minería de grafos se volvió popular hace 10 años.
  • También tuvo popularidad antes de que el aprendizaje geométrico, las formas de aprendizaje automático sobre grafos y otras estructuras, así como los modelos de asignación latente de Dirichlet (LMMs), se volvieran más comunes.
  • Arangodb, un sistema de base de datos, incluye integración con varias bibliotecas de grafos y frameworks de aprendizaje automático como NetworkX, DeepGraphLibrary, cuGraph y PyG.
  • Hay una pregunta sobre cómo se construye la biblioteca usando Bazel, una herramienta para automatizar la compilación y las pruebas de software.
  • La biblioteca podría integrarse con wrappers o bibliotecas de extensión para incorporar algoritmos de clustering basados en grafos.
  • Hay una pregunta sobre la relación entre Pregel, un sistema de procesamiento de grafos a gran escala, y la biblioteca.
  • Se pide una explicación sobre los posibles usos de la biblioteca y ejemplos de aplicación.
  • La biblioteca está escrita en C, C++ y Starland, y hay una pregunta sobre qué es Starland.
  • Al igual que con Basic Linear Algebra Subprograms (BLAS) y Linear Algebra Package (LAPACK), hay voces que piden estandarización en los algoritmos de grafos.
  • Algunos esperaban que la biblioteca pudiera usarse para minería estadística de grafos para detección de anomalías.