nanoGPT - código abierto para entrenar/ajustar fino GPT de escala media lo más rápido posible
(github.com/karpathy)- Código reescrito por Andrej Karpathy, exlíder de IA en Tesla, a partir de minGPT
- Objetivo: escribir código legible y convencional
train.pyde unas 300 líneasmodel.pyde unas 300 líneas
- Trabajando en reproducir GPT-2 con el conjunto de datos OpenWebText
Aún no hay comentarios.