22 puntos por xguru 2025-05-20 | Aún no hay comentarios. | Compartir por WhatsApp

"The web as a database"

  • Un motor de búsqueda basado en embeddings para superar las limitaciones de la búsqueda por palabras clave, que devuelve solo resultados que coinciden con precisión con la intención del usuario
  • Funciona con un proceso de varias etapas según el significado de la consulta: búsqueda de embeddings vectoriales en toda la web → validación basada en LLM → entrega de resultados depurados
  • En lugar de una lista común, presenta los resultados en formato de tabla, y permite agregar las columnas deseadas para recopilar información adicional de forma asíncrona
    • Cada celda se carga individualmente de forma asíncrona, y está diseñado para permitir explorar la web como si fuera una base de datos
  • Por ejemplo, puede encontrar con precisión incluso condiciones específicas y complejas como "startups de herramientas de desarrollo open source ubicadas en San Francisco y fundadas entre 2021 y 2025"
  • Cada resultado es evaluado por un LLM para verificar si realmente cumple las condiciones de búsqueda, y se entrega junto con la evidencia (fuentes) que demuestra que cumple esas condiciones
    • El tiempo de procesamiento puede ir de unos minutos a varias horas
  • Ejemplo de búsqueda: blogs de matemáticas creados por profesores de matemáticas fuera de Estados Unidos
  • Video demo: https://youtu.be/Unt8hJmCxd4
  • Documentación de la API: https://docs.exa.ai/websets

Aún no hay comentarios.

Aún no hay comentarios.