9 puntos por xguru 2024-08-08 | Aún no hay comentarios. | Compartir por WhatsApp
  • Versión de Llama 3.1 al estilo nanoGPT implementada por Andrej Karpathy
  • Implementación mínima de la arquitectura de Llama 3.1, sin dependencias, que permite entrenar, ajustar finamente e inferir de forma muy sencilla
    • Tiene menos dependencias y un código más pequeño que las implementaciones de Meta y HuggingFace
  • Actualmente se enfoca en el modelo base 8B de Llama 3.1
  • WIP: todavía está en desarrollo y no está terminado

Aún no hay comentarios.

Aún no hay comentarios.