"Open Pre-trained Transformer Language Model"
- Construir modelos de lenguaje tan grandes requiere una inversión considerable, y es difícil investigarlos cuando solo se ofrece acceso por API
- Para los investigadores interesados, publicaron para descarga el modelo completo, el código experimental y el cuaderno de registros
- Requiere solo 1/7 de la huella de carbono de GPT-3
1 comentarios
https://github.com/facebookresearch/metaseq