- En HN ha aumentado mucho el interés por el ajuste fino de LLM de código abierto (por ejemplo, la publicación de Anyscale)
- Se comparten años de experiencia y aprendizajes sobre ajuste fino de modelos, junto con código práctico
- Se ofrece un conjunto de notebooks que cubren etiquetado de datos, ajuste fino, ejecución eficiente de inferencia y evaluación de costo/rendimiento
- Se entrenó un modelo 7B que coincide en un 95% con las etiquetas de GPT-4 en el conjunto de prueba
- ¿Qué es el ajuste fino? Una forma de prompting más poderosa que escribir instrucciones en texto
- Se entrena un modelo existente con pares de entrada/salida de ejemplo para el entrenamiento de modelos ajustados finamente
- Ventajas y desventajas del prompting y del ajuste fino
- Gran ventaja del ajuste fino: es mucho más efectivo para indicar el comportamiento del modelo, por lo que incluso un modelo mucho más pequeño puede ser suficiente
- Un modelo Llama 7B ajustado finamente es 50 veces más barato por token que GPT-3.5 y ofrece resultados iguales o mejores en muchos casos de uso
- Ejemplo: clasificar 2M de recetas con GPT-4 costaría $23k, pero nuestro modelo ajustado finamente muestra un rendimiento similar al de GPT-4 y cuesta solo $19 ejecutar todo el dataset
- Están desarrollando un producto de código abierto llamado OpenPipe
- OpenPipe ayuda a que los ingenieros adopten el ajuste fino de la forma más simple posible
- Esta publicación actual busca compartir lo aprendido sobre ajuste fino
1 comentarios
Opiniones de Hacker News