La nueva herramienta File Search de Gemini API de Google simplifica de forma radical la creación de sistemas RAG (Retrieval-Augmented Generation):
- En lugar del complejo proceso tradicional de chunking, embeddings y configuración de una base de datos vectorial, todo se procesa automáticamente con una sola carga de archivos (2 líneas de código), y al consultar busca documentos relevantes y los inyecta en el modelo.
- El almacenamiento y los embeddings de consulta son gratis; solo el indexado inicial cuesta $0.15 por 1 millón de tokens.
- Archivos compatibles: PDF, DOCX, TXT, etc.
- Como ejemplo práctico, la búsqueda en 3,000 archivos se completa en 2 segundos, reduciendo mucho el tiempo de desarrollo de prototipos.
- Además ofrece funciones como citas automáticas y filtrado por metadatos.
- Limitaciones: máximo de 10 stores por proyecto, nivel gratuito de 1 GB.
- Evaluación: baja la barrera de entrada para el desarrollo con RAG y permite enfocarse en la aplicación.
3 comentarios
Como era de esperarse de Google.
Gracias por compartirlo. ¡La calidad! De verdad me da mucha curiosidad.
Vi que estaban ofreciendo notebooklm como servicio y pensé que en algún momento quizá sacarían algo tipo una API de notebooklm, y resulta que lo lanzaron como un servicio de API llamado File Search, wow.
Había una barrera clara para intentar hacer bien RAG: montar pipelines/workflows, levantar Ollama e ir probando y cambiando entre uno y otro modelo, pero si la calidad está garantizada hasta cierto punto (habrá que probarlo para saberlo), la verdad es que sería comodísimo de usar