¿Qué es una cadena de Markov?
- Cuando aparecieron por primera vez los LLMs (modelos de lenguaje grandes), la gente los describía como cadenas de Markov muy inteligentes
- Hoy en día, la gente está más familiarizada con los LLMs que con las cadenas de Markov
- Una cadena de Markov puede considerarse un LLM muy pequeño, muy simple y muy ingenuo
- Una cadena de Markov predice la siguiente palabra basándose en el contexto actual, pero no toma en cuenta semántica, dimensionalidad ni otras matemáticas vectoriales complejas
- Una cadena de Markov es un modelo estadístico primitivo
- La función de "sugerencia de la siguiente palabra" en el teclado del celular normalmente usa cadenas de Markov
- Las cadenas de Markov son baratas de ejecutar y se pueden actualizar fácilmente para adaptarse al estilo de texto del usuario
- Se podría explicar en profundidad cómo funcionan los LLMs y las cadenas de Markov, pero aquí basta con saber que las cadenas de Markov son menos capaces que los LLMs para realizar tareas
¿Qué es lo divertido?
- El humor trata de una sorpresa no seria
- Los mejores chistes incluyen un "snap" agradable e importante
- "Snap" se refiere al impacto que proviene de la sorpresa
- Cuanta menos sorpresa haya, menos gracioso será
- Esa es la razón por la que, mientras más chistes escuchas, menos graciosos te parecen
- El humor "random" no da risa porque su imprevisibilidad resulta predecible
- Escribir chistes consiste en romper patrones
- El "hacer real una escena" puede reforzar el snap
- Si usas un lenguaje más original o más descriptivo, la escena se ve más realista
- Los chistes son diversos y el humor es subjetivo
La predictibilidad de los LLMs
- Para predecir una oración con éxito, se necesita mucho contexto
- Los LLMs tienen mucho contexto
- Los LLMs encuentran el siguiente token más probable mediante una gran cantidad de cálculo matemático
- Un LLM "mejor" es más predecible
- Los LLMs no son adecuados para la escritura creativa
- Los LLMs generan resultados promedio
- Para generar chistes, un LLM necesita sorprender
- Un buen LLM no hace eso bien
- Los LLMs no son adecuados para la expresión artística
- Los LLMs pueden pasar por alto conceptos interesantes
- Con este marco sería posible crear nuevos modelos de lenguaje
Por qué esto es interesante
- Esto apunta a algo más profundo
- No se trata del debate entre alma y máquina
- Esto muestra defectos inherentes del modelo
- Los mensajes de ChatGPT parecen ensayos de preparatoria
- Esto reproduce una salida promedio
- A esto se le ha quitado la personalidad y se le ha reforzado con rigor académico
- Es una voz plana y corporativa
- Las reseñas falsas de Amazon se pueden identificar fácilmente
- Los modelos de detección de LLM pronto tendrán que revisar la personalidad
Resumen de GN⁺
- Este artículo explica las diferencias entre las cadenas de Markov y los LLMs, y explora la naturaleza del humor
- Las cadenas de Markov son modelos estadísticos simples y tienen menor capacidad de predicción que los LLMs
- El humor se basa en una sorpresa no seria, y escribir chistes consiste en romper patrones
- Los LLMs son muy predecibles, por lo que no son adecuados para la escritura creativa
- Este artículo muestra las limitaciones de los LLMs y plantea la posibilidad de nuevos modelos de lenguaje
1 comentarios
Opiniones de Hacker News
Llegué a la misma conclusión hace unos años mientras hacía un proyecto paralelo
Le pedí a Claude 3.5 Sonnet que escribiera 10 chistes cortos sobre por qué las cadenas de Markov son más divertidas que los LLM
No significa que la cadena de Markov sea mejor
Cuando estaba en la universidad, unos amigos usaron un generador de cadenas de Markov para la sección de "reportes policiales" del periódico universitario
Me incomoda usar la Biblia para este tipo de experimentos
Como evidencia empírica, /r/subreddit simulator es una parodia de Reddit basada en Markov
Publiqué varias veces en Reddit "falsos XYZ escritos por IA"
Hace unos 10 años, cuando estudiaba, hice un bot de Twitter con Markov
La evolución del blog AI weirdness respalda esta idea
Tengo dos bots en mi servidor personal de Discord