6 puntos por xguru 2023-05-11 | 1 comentarios | Compartir por WhatsApp
  • El primer desafío abierto de la comunidad en el mundo donde los usuarios evalúan los modelos que se suben
  • La temporada 1, episodio 1 comienza el 10 de junio, con premios por $250k durante 12 semanas
  • Formato de la competencia
    • Se publicará como open source el Chai Reward Model (GPT-2), entrenado directamente con 170 millones de señales generadas por usuarios
    • Este modelo puede usarse para evaluación offline o integrarse como parte de un pipeline de RLHF
    • Como entrenar modelos de lenguaje cuesta mucho, planean probar varios modelos base para que cualquiera pueda participar en la competencia
    • Para los modelos subidos, verificarán con un clasificador interno de seguridad de IA si pueden desplegarse, y luego se publicarán para pruebas A/B con usuarios
    • Evaluación por más de alrededor de 1 millón de usuarios reales

1 comentarios

 
xguru 2023-05-11

La imagen de Llama fusionado como si fuera un Super Saiyajin es bastante impactante.