- "Less Is More for Alignment"
- Modelo LLaMA afinado con solo 1000 prompts bien curados, sin aprendizaje por refuerzo ni modelado de preferencias
- En el 43% de los casos fue igual o más preferido que GPT-4; frente a Bard, 58%, y 65% más alto que DaVinci003 entrenado con retroalimentación humana
- La hipótesis del paper es que casi todo el conocimiento de los LLM se aprende durante el preentrenamiento, y que el alignment es un proceso simple de aprender el formato/estilo para interactuar con los usuarios
- Nuevo paper de Meta AI
4 comentarios
Deberían haber continuado el Proyecto Sejong y seguir acumulando datos de modelos de lenguaje en coreano como open source. De verdad, qué lástima de proyecto...
Es una lástima que, aunque el rendimiento en inglés mejora tan rápido, la mayoría de los modelos fuera de GPT no manejen bien el coreano...
El aprendizaje de coreano de Claude de Anthropic está en un nivel bastante alto, pero todavía su capacidad de expresión difiere en algunos aspectos frente a ChatGPT.
T_T Sí, es cierto, en coreano todo excepto la API de GPT está a nivel de basura...