LIMA - Lograr un rendimiento cercano a GPT-4 con un modelo LLaMA de 65B y solo 1000 prompts

xguru · 2023-05-23T09:36:28+09:00

"Less Is More for Alignment" Modelo LLaMA afinado con solo 1000 prompts bien curados, sin aprendizaje por refuerzo ni modelado de preferencias En el 43% de los casos fue igual o más preferido que GPT-4; frente a Bard, 58%, y 65% más alto que DaVinci003 entrenado con retroalimentación humana La hipótesis del paper es que casi todo el conocimiento de los LLM se aprende durante el preentrenamiento, y que el alignment es un proceso simple de aprender el formato/estilo para interactuar con los usuarios Nuevo paper de Meta AI

(arxiv.org)

24 puntos por xguru 2023-05-23 | 4 comentarios | Compartir por WhatsApp

"Less Is More for Alignment"
Modelo LLaMA afinado con solo 1000 prompts bien curados, sin aprendizaje por refuerzo ni modelado de preferencias
En el 43% de los casos fue igual o más preferido que GPT-4; frente a Bard, 58%, y 65% más alto que DaVinci003 entrenado con retroalimentación humana
La hipótesis del paper es que casi todo el conocimiento de los LLM se aprende durante el preentrenamiento, y que el alignment es un proceso simple de aprender el formato/estilo para interactuar con los usuarios
Nuevo paper de Meta AI

4 comentarios

merong 2023-05-23

Deberían haber continuado el Proyecto Sejong y seguir acumulando datos de modelos de lenguaje en coreano como open source. De verdad, qué lástima de proyecto...

kuroneko 2023-05-23

Es una lástima que, aunque el rendimiento en inglés mejora tan rápido, la mayoría de los modelos fuera de GPT no manejen bien el coreano...

dulco 2023-05-23

El aprendizaje de coreano de Claude de Anthropic está en un nivel bastante alto, pero todavía su capacidad de expresión difiere en algunos aspectos frente a ChatGPT.

test4458 2023-05-23

T_T Sí, es cierto, en coreano todo excepto la API de GPT está a nivel de basura...

LIMA - Lograr un rendimiento cercano a GPT-4 con un modelo LLaMA de 65B y solo 1000 prompts

Lecturas relacionadas

4 comentarios