- Versión especializada en coreano del modelo GPT-3 creado por Kakao Brain
→ construida con base en 6 mil millones de parámetros y 200 mil millones de tokens de datos en coreano
-
Puede realizar todo tipo de tareas de lenguaje, como determinar si una oración es positiva o negativa, resumir en una línea textos largos, inferir una oración para predecir una conclusión y responder preguntas comprendiendo el contexto
-
Después del coreano, está previsto abrir como open source modelos en inglés, japonés, vietnamita y malayo
-
El objetivo es garantizar la accesibilidad al abrirlo como open source y contribuir al desarrollo de la tecnología de TI local y a la activación de la investigación
3 comentarios
Sitio de demostración: https://huggingface.co/spaces/akhaliq/kogpt
Al ingresar tal cual la siguiente oración que venía como ejemplo aquí, tardó unos 2 minutos incluso con la espera en cola, y produjo este resultado. Parece que el tiempo real usado para el procesamiento fue de unos 16.9 segundos.
input:
“Pensar y actuar como un ser humano, a través de una ‘inteligencia’ con la que la humanidad hasta ahora no había podido resolver”
output:
“Ha llegado una era en la que debemos responder innumerables preguntas que la humanidad hasta ahora no había podido resolver a través de una ‘inteligencia’ que piensa y actúa como un ser humano. c Pixabay A lo largo de las últimas decenas de miles de años, lo más importante que nuestra humanidad ha tenido que resolver para vivir una vida verdaderamente humana”
Qué bueno.
GPT-J-6B, Cedille y KoGPT son todos de la familia de 6 mil millones (6B) de parámetros.
GPT-3 ya no es el único en el mercado https://es.news.hada.io/topic?id=5349
GPT-Neo: un proyecto para crear un modelo a escala de GPT-3 como open source/gratuito https://es.news.hada.io/topic?id=3599
Cedille - se libera como open source un modelo en francés de escala 6B https://es.news.hada.io/topic?id=5372