7 puntos por xguru 2023-05-03 | 1 comentarios | Compartir por WhatsApp
  • Permite entrenar a LLaMA como un modelo de seguimiento de instrucciones y multimodal en solo 1 hora, con apenas 1.2 millones de parámetros entrenables
  • Alpaca requiere 7B de parámetros, 13G de almacenamiento y 3 horas, mientras que
    LLaMA-Adapter necesita 1.2M de parámetros, 4.7M de almacenamiento y 1 hora

1 comentarios

 
bytebrawlers 2023-05-03

¿No es que el punto principal es que usó un método PEFT similar a LoRA y, sobre todo, que admite contexto visual? Ya hay demasiados enfoques SFT (Instruction Fine Tune) de PEFT para LLaMA...