6 puntos por xguru 2023-07-01 | 2 comentarios | Compartir por WhatsApp
  • Creado al tomar el contenido del paper Orca de Microsoft y replicarlo como código abierto
    • Aproximadamente 1 millón de FLANv2 mejorados con completions de GPT-4
    • Aproximadamente 3.5 millones de FLANv2 mejorados con completions de GPT-3.4
  • Incluye los 75k CoT completos del conjunto de datos FLAN-1m
  • Actualmente se está realizando fine-tuning de todos los pesos sobre la base de LLaMA-13B, por lo que tendrá un rendimiento similar al de Microsoft
    • OpenOrca-LLaMA-13b podría lanzarse hacia mediados de julio
  • Están buscando patrocinio de cómputo GPU para aplicar OpenOrca a otras plataformas (Falcon, LLaMA, MPT, etc.)

2 comentarios

 
ninebow 2023-07-02

Ups, el enlace da 404.

Puedes revisar el dataset en Open-Orca/OpenOrca de HuggingFace. :D

 
xguru 2023-07-02

Ah, parece que borraron la publicación.

Todavía queda en WaybackMachine.

https://web.archive.org/web/20230629002546/…

Ya dejé el enlace corregido con el link de HuggingFace que compartieron.