4 puntos por xguru 2023-09-08 | Aún no hay comentarios. | Compartir por WhatsApp
  • Un servicio para entrenar fácilmente modelos a gran escala en el clúster de Hugging Face sin procesos complejos
  • Se pueden modificar los valores principales en el cuadro combinado para consultar el precio
    I want to train a "7B/13B/30B/70B" parameters "text/multimodal" model on a "1.4T/3.5T/7T" tokens dataset, on "200/500/1000" "A100/H100 GPUs/Trainium Nodes"
  • Si eliges entrenar un modelo de texto de 70B parámetros con un dataset de 1.4T tokens usando 500 GPUs H100,
    el tiempo total es de 57 días y el precio es de $2,879,856

Aún no hay comentarios.

Aún no hay comentarios.