"¿Eres más inteligente que un modelo de lenguaje?"
Muchos benchmarks intentan evaluar qué tan bien los modelos de lenguaje realizan tareas humanas.
Pero, ¿qué tan bien podrías hacerlo tú en la tarea típica de un modelo de lenguaje de predecir la siguiente palabra?
Resuelve 15 preguntas
3 comentarios
4 puntos... el resultado sí da coraje
Oh, Dios mío. Como lo resolví como si fuera un ejercicio de inglés, me salió un puntaje bajísimo :(
Opiniones de Hacker News
No es lo que esperaba por el título de "smart", pero es una idea interesante
Hicieron un juego/quiz de adivinar la siguiente palabra a partir de comentarios de Hacker News
logit_biaspara que solo pudieran elegir una de las respuestas permitidasLa estrategia ganadora es elegir la palabra que el modelo de lenguaje tenga menos probabilidad de escoger
Al ver los resultados, parece imposible predecir con precisión la siguiente palabra con la información dada
Este juego es una buena prueba para ver si lees demasiados comentarios de HN
Como recibes un quiz aleatorio cada vez, no se pueden comparar resultados
Gracias al tiempo que pasé en HN, pude hacer predicciones un poco mejores que la IA
Para quienes intenten el quiz de 100 preguntas: según los criterios estadísticos tradicionales, acertar más de un tercio ya se considera mejor que adivinar
Si la muestra salió de HN, existe la posibilidad de que el texto ya formara parte del dataset
Algunas opciones estaban extraídas de un contexto más amplio, lo que pone al LLM en una posición favorable para predecir