Guanaco - competencia de fine-tuning de LLM con $1M (130 millones de KRW)

xguru · 2023-05-11T10:03:02+09:00

El primer desafío abierto de la comunidad en el mundo donde los usuarios evalúan los modelos que se suben La temporada 1, episodio 1 comienza el 10 de junio, con premios por $250k durante 12 semanas Formato de la competencia Se publicará como open source el Chai Reward Model (GPT-2), entrenado directamente con 170 millones de señales generadas por usuarios Este modelo puede usarse para evaluación offline o integrarse como parte de un pipeline de RLHF Como entrenar modelos de lenguaje cuesta mucho, planean probar varios modelos base para que cualquiera pueda participar en la competencia Para los modelos subidos, verificarán con un clasificador interno de seguridad de IA si pueden desplegarse, y luego se publicarán para pruebas A/B con usuarios Evaluación por más de alrededor de 1 millón de usuarios reales

El primer desafío abierto de la comunidad en el mundo donde los usuarios evalúan los modelos que se suben
La temporada 1, episodio 1 comienza el 10 de junio, con premios por $250k durante 12 semanas
Formato de la competencia
- Se publicará como open source el Chai Reward Model (GPT-2), entrenado directamente con 170 millones de señales generadas por usuarios
- Este modelo puede usarse para evaluación offline o integrarse como parte de un pipeline de RLHF
- Como entrenar modelos de lenguaje cuesta mucho, planean probar varios modelos base para que cualquiera pueda participar en la competencia
- Para los modelos subidos, verificarán con un clasificador interno de seguridad de IA si pueden desplegarse, y luego se publicarán para pruebas A/B con usuarios
- Evaluación por más de alrededor de 1 millón de usuarios reales

Guanaco - competencia de fine-tuning de LLM con $1M (130 millones de KRW)

Lecturas relacionadas

1 comentarios