- El primer desafío abierto de la comunidad en el mundo donde los usuarios evalúan los modelos que se suben
- La temporada 1, episodio 1 comienza el 10 de junio, con premios por $250k durante 12 semanas
- Formato de la competencia
- Se publicará como open source el Chai Reward Model (GPT-2), entrenado directamente con 170 millones de señales generadas por usuarios
- Este modelo puede usarse para evaluación offline o integrarse como parte de un pipeline de RLHF
- Como entrenar modelos de lenguaje cuesta mucho, planean probar varios modelos base para que cualquiera pueda participar en la competencia
- Para los modelos subidos, verificarán con un clasificador interno de seguridad de IA si pueden desplegarse, y luego se publicarán para pruebas A/B con usuarios
- Evaluación por más de alrededor de 1 millón de usuarios reales
1 comentarios
La imagen de Llama fusionado como si fuera un Super Saiyajin es bastante impactante.