- OpenAI anunció el ajuste fino y actualizaciones de la API para GPT-3.5 Turbo, lo que permite a los desarrolladores personalizar el modelo para casos de uso específicos.
- Se espera que el ajuste fino para GPT-4 esté disponible en otoño.
- Las pruebas iniciales mostraron que GPT-3.5 Turbo ajustado finamente puede superar o igualar el rendimiento base de GPT-4 en tareas específicas.
- Los datos enviados a través de la API de ajuste fino pertenecen al cliente y OpenAI ni otras organizaciones los utilizan para entrenar otros modelos.
- El ajuste fino se ha usado para mejorar el rendimiento del modelo en casos de uso comunes, como una mejor capacidad de control, formatos de salida confiables y un tono personalizado.
- El ajuste fino permite a las empresas acortar los prompts mientras mantienen un rendimiento similar, y manejar 4k tokens, el doble que los modelos ajustados finamente anteriores.
- El ajuste fino es más efectivo cuando se combina con técnicas como prompt engineering, recuperación de información y function calling.
- El costo del ajuste fino se divide en dos partes: costo de entrenamiento inicial y costo de uso.
- OpenAI también ofrece babbage-002 y davinci-002 como reemplazos de los modelos base originales de GPT-3, y estos pueden ajustarse finamente mediante nuevos endpoints de API.
- El endpoint existente
/v1/fine-tunes dejará de estar disponible el 4 de enero de 2024.
- OpenAI también trabaja para garantizar la seguridad de los despliegues de ajuste fino, y los datos de entrenamiento para ajuste fino se analizan mediante su Moderation API y un sistema de filtrado basado en GPT-4 para detectar datos inseguros.
- En un futuro cercano se lanzará una UI de ajuste fino, que permitirá a los desarrolladores acceder más fácilmente a información sobre trabajos de ajuste fino en curso y snapshots de modelos completados.
1 comentarios
Opiniones de Hacker News