YaLM 100B - modelo de lenguaje tipo GPT de 100 mil millones de parámetros
(github.com/yandex)- Yandex lo publicó y cualquier desarrollador/investigador puede usarlo gratis
- Entrenado durante 65 días con 800 GPU A100 sobre 1.7 TB de texto en inglés y ruso
- Basado en el código Megatron-LM de Microsoft
Aún no hay comentarios.