- Un artículo sobre un nuevo motor de búsqueda de Wikipedia basado en el navegador, con búsqueda sin conexión
- Motor de búsqueda con capacidad de buscar en tiempo real entre un millón de páginas de Wikipedia, devolviendo resultados cada 10 ms en dispositivos móviles
- El tamaño reducido de la base de datos del motor de búsqueda, un caso de uso casual que admite un millón de embeddings sin procesamiento especial
- Motor de búsqueda que usa un transformador de oraciones para generar embeddings de documentos, compresión de embeddings mediante cuantización de producto y
pq.js para ejecutar el cálculo de distancias en el navegador
- Uso de
transformers.js para ejecutar en el navegador el transformador de oraciones para las consultas del motor de búsqueda
- Motor de búsqueda que ordena los embeddings según el tamaño comprimido de las páginas, analizando primero las páginas con mayor densidad de información y devolviéndolas en el top 10
- Motor de búsqueda que usa Arrow en lugar de JSON para alto rendimiento; Arrow puede almacenar de forma compacta arreglos de cuantización de producto de enteros de 8 bits
- Motor de búsqueda que usa modelos ONNX ejecutados en WebAssembly; todavía no hay aceleración por GPU
- Motor de búsqueda que genera embeddings de toda Wikipedia con un transformador de oraciones, comprime los embeddings con cuantización de producto y escribe ONNX manualmente
- Motor de búsqueda que exporta
numpy a Arrow para almacenar embeddings y metadatos, de forma mucho más compacta en memoria y en disco
- Motor de búsqueda compatible con búsqueda facetada que permite búsquedas en tiempo real dentro de subcategorías de productos
- El autor invita comentarios y sugerencias de mejora, especialmente sobre soporte para otros niveles de cuantización y otras dimensiones de embeddings
1 comentarios
Opiniones de Hacker News