Ajuste fino de Mistral 7B en el draft de Magic: The Gathering
(generallyintelligent.substack.com)Resumen: explorando la técnica de ajuste fino en inteligencia artificial
- Efectividad y dificultad de la técnica de ajuste fino
- El ajuste fino complementa las capacidades de GPT-4 y promete mayor velocidad y eficiencia de costos.
- Para resolver la falta de información sobre qué tan efectivo y difícil es realmente el ajuste fino, se realizó un experimento directo.
Elección del problema
- Prueba de la capacidad de razonamiento del modelo mediante el draft de Magic: The Gathering (MTG)
- MTG es un juego de cartas estratégico, y el draft consiste en elegir cartas de un conjunto aleatorio para construir un mazo.
- El draft es una tarea compleja adecuada porque requiere razonamiento y comprensión de datos nuevos.
- Se aprovechó el gran volumen de datos históricos proporcionado por el servicio 17lands, usando las elecciones de draft de los mejores jugadores como "ground truth".
Resultados y resumen
- Rendimiento del modelo 7B ajustado finamente
- El modelo 7B ajustado finamente superó a GPT-4 y mostró un rendimiento cercano al nivel humano.
- Ajustar finamente GPT-3.5 podría mostrar mejores resultados, pero el costo es muy alto.
- El ajuste fino sigue siendo un proceso experimental, especialmente porque la ingeniería de prompts consume mucho tiempo.
- Después del ajuste fino con un nuevo set de cartas, también mostró capacidad de generalización en sets de cartas no vistos.
Reporte de campo: método y proceso de aprendizaje
- Construcción de datos
- Los datos en formato CSV de 17lands se transformaron a formato de texto para hacerlos adecuados para el ajuste fino.
- El formateo de datos fue un proceso desafiante y experimental.
- Ejecución del ajuste fino
- Debido a problemas de acceso a GPU, se rentó una GPU por hora en Runpod.
- Se usó axolotl para implementar fácilmente la optimización del ajuste fino.
- Evaluación
- Es importante establecer criterios de evaluación antes de comenzar el experimento.
- Definir criterios de evaluación para modelos de lenguaje puede ser difícil.
Lecciones principales
- Efecto del ajuste fino
- El ajuste fino con datos nuevos supera a GPT-4 en precisión y costo.
- El ajuste fino requiere un proceso experimental para hacerse correctamente y es una habilidad especializada más difícil de aprender que la ingeniería de prompts.
Información adicional relacionada con Magic
- Rendimiento del bot de draft de IA ajustado finamente
- Se desarrolló una app de asistencia para draft usando un modelo de draft conectado a los logs de Magic Arena.
- El modelo ajustado finamente genera las elecciones, pero GPT-4 proporciona las explicaciones.
- Al simular varios bots de draft de IA, mostró un rendimiento similar al de los drafters humanos.
Opinión de GN⁺
El punto más importante de este artículo es que la técnica de ajuste fino tiene el potencial de superar el rendimiento de los modelos de lenguaje grandes existentes (como GPT-4) y, a través de ello, mejorar significativamente la comprensión y la eficiencia de la inteligencia artificial para tareas específicas. Lo que hace interesante este texto es que muestra el proceso concreto y sus efectos mediante un caso de aplicación real, lo que también puede ayudar a ingenieros de software principiantes a entender el potencial de avance de la tecnología de IA y cómo aplicarla.
1 comentarios
Comentarios de Hacker News