Ask HN: A diciembre de 2023, ¿cómo entrenar un LLM/ChatGPT personalizado con mis documentos?

(news.ycombinator.com)

4 puntos por GN⁺ 2023-12-26 | 1 comentarios | Compartir por WhatsApp

Hay un hilo relacionado de hace 5 meses, pero podría contener información desactualizada, así que se busca de nuevo el enfoque a diciembre de 2023
El punto central de la pregunta es cuál es la mejor manera de proporcionar un conjunto de documentos personalizados a un LLM para obtener respuestas de calidad aceptable y con pocas alucinaciones
No se limita solo a entrenar un modelo propio, sino que aborda en general las formas de hacer que responda preguntas basándose en documentos, incluidos enfoques como RAG

1 comentarios

GN⁺ 2023-12-26

Opiniones de Hacker News

En realidad no se entrena sobre los documentos; aunque muchas startups usan ese término, en la práctica usan RAG (Retrieval-Augmented Generation).
- Llamaindex es considerado la mejor opción.
- La mayoría de las startups que afirman entrenar sobre documentos en realidad usan RAG.
- Recomiendan buscar scripts que generen automáticamente pares de preguntas y respuestas usando qLoRA.
- Hay pocos casos de uso exitosos para una base de conocimiento de documentos personales; se usa principalmente para habilidades como matemáticas, razonamiento y Python.
- Se ha demostrado empíricamente que simplemente meter un conjunto de documentos en un ajuste fino no funciona.
Dependiendo de la cantidad de documentos, conviene considerar enfoques distintos.
- RAG funciona bien con datasets pequeños, y Llamaindex ha hecho mucho trabajo de ingeniería en este campo.
- La combinación de ajuste fino y RAG es efectiva para datasets grandes con conocimiento que se puede encontrar fácilmente en internet.
- El preentrenamiento continuo es necesario cuando se tiene un dataset muy grande y conocimiento propietario.
AWS Bedrock es fácil de usar: puedes subir documentos a S3, sincronizarlos con una base de datos vectorial y usarlos mediante una API.
- Bedrock es un producto que ofrece varios modelos y una API común.
h2ogpt es una implementación de RAG muy completa que puede procesar documentos en varios formatos y soporta distintas implementaciones de hosting de modelos.
Se puede comprar una cuenta de ChatGPT y subir tus propios documentos, con lo que es posible crear una IA conversacional personalizada.
GPT4 Assistants actualmente puede manejar RAG de forma nativa, y PrivateGPT es una de las opciones más conocidas para esto.
Copilot Builder de Microsoft Office permite crear un AI Copilot en segundos especificando una URL base, archivos subidos, etc.
Cheshire Cat es un framework de asistentes de IA que guarda documentos como "memoria" para poder recuperarlos después.
Hay una guía en video sobre cómo hacer ajuste fino de Mistral 7B con QLoRA, y se menciona que la técnica RAG podría ser más recomendable.

Ask HN: A diciembre de 2023, ¿cómo entrenar un LLM/ChatGPT personalizado con mis documentos?

Lecturas relacionadas

1 comentarios

Opiniones de Hacker News