Cómo proporcionar un conjunto de documentos personalizado a un LLM
- Debate sobre la mejor forma de proporcionar a un LLM (Large Language Models) un conjunto de documentos del usuario para obtener respuestas adecuadas sin resultados irreales.
- Se centra en cómo "enseñarle" a un LLM un conjunto de documentos específico. Esto no necesariamente significa entrenar un modelo propio, y también incluye enfoques como RAG (Retrieval-Augmented Generation).
- Existe un hilo de hace 5 meses, pero se necesita información acorde con la situación actual de diciembre de 2023.
Opinión de GN⁺
- Extraer información precisa de un conjunto de documentos específico usando un LLM se está volviendo más importante a medida que avanza la tecnología.
- Estas técnicas ayudan a que los usuarios obtengan resultados personalizados según lo que buscan, y pueden aplicarse en distintos campos como inteligencia de negocios, investigación y educación.
- Es importante aprovechar enfoques existentes como RAG o explorar métodos nuevos, ya que esto contribuirá a mejorar el uso de los LLM y a obtener resultados más precisos y confiables.
1 comentarios
Opiniones de Hacker News
En realidad no se entrena sobre los documentos; aunque muchas startups usan ese término, en la práctica usan RAG (Retrieval-Augmented Generation).
Dependiendo de la cantidad de documentos, conviene considerar enfoques distintos.
AWS Bedrock es fácil de usar: puedes subir documentos a S3, sincronizarlos con una base de datos vectorial y usarlos mediante una API.
h2ogpt es una implementación de RAG muy completa que puede procesar documentos en varios formatos y soporta distintas implementaciones de hosting de modelos.
Se puede comprar una cuenta de ChatGPT y subir tus propios documentos, con lo que es posible crear una IA conversacional personalizada.
GPT4 Assistants actualmente puede manejar RAG de forma nativa, y PrivateGPT es una de las opciones más conocidas para esto.
Copilot Builder de Microsoft Office permite crear un AI Copilot en segundos especificando una URL base, archivos subidos, etc.
Cheshire Cat es un framework de asistentes de IA que guarda documentos como "memoria" para poder recuperarlos después.
Hay una guía en video sobre cómo hacer ajuste fino de Mistral 7B con QLoRA, y se menciona que la técnica RAG podría ser más recomendable.