24 puntos por xguru 2023-05-23 | 4 comentarios | Compartir por WhatsApp
  • "Less Is More for Alignment"
  • Modelo LLaMA afinado con solo 1000 prompts bien curados, sin aprendizaje por refuerzo ni modelado de preferencias
  • En el 43% de los casos fue igual o más preferido que GPT-4; frente a Bard, 58%, y 65% más alto que DaVinci003 entrenado con retroalimentación humana
  • La hipótesis del paper es que casi todo el conocimiento de los LLM se aprende durante el preentrenamiento, y que el alignment es un proceso simple de aprender el formato/estilo para interactuar con los usuarios
  • Nuevo paper de Meta AI

4 comentarios

 
merong 2023-05-23

Deberían haber continuado el Proyecto Sejong y seguir acumulando datos de modelos de lenguaje en coreano como open source. De verdad, qué lástima de proyecto...

 
kuroneko 2023-05-23

Es una lástima que, aunque el rendimiento en inglés mejora tan rápido, la mayoría de los modelos fuera de GPT no manejen bien el coreano...

 
dulco 2023-05-23

El aprendizaje de coreano de Claude de Anthropic está en un nivel bastante alto, pero todavía su capacidad de expresión difiere en algunos aspectos frente a ChatGPT.

 
test4458 2023-05-23

T_T Sí, es cierto, en coreano todo excepto la API de GPT está a nivel de basura...