5 puntos por GN⁺ 2024-08-19 | 1 comentarios | Compartir por WhatsApp

¿Qué es una cadena de Markov?

  • Cuando aparecieron por primera vez los LLMs (modelos de lenguaje grandes), la gente los describía como cadenas de Markov muy inteligentes
  • Hoy en día, la gente está más familiarizada con los LLMs que con las cadenas de Markov
  • Una cadena de Markov puede considerarse un LLM muy pequeño, muy simple y muy ingenuo
  • Una cadena de Markov predice la siguiente palabra basándose en el contexto actual, pero no toma en cuenta semántica, dimensionalidad ni otras matemáticas vectoriales complejas
  • Una cadena de Markov es un modelo estadístico primitivo
  • La función de "sugerencia de la siguiente palabra" en el teclado del celular normalmente usa cadenas de Markov
  • Las cadenas de Markov son baratas de ejecutar y se pueden actualizar fácilmente para adaptarse al estilo de texto del usuario
  • Se podría explicar en profundidad cómo funcionan los LLMs y las cadenas de Markov, pero aquí basta con saber que las cadenas de Markov son menos capaces que los LLMs para realizar tareas

¿Qué es lo divertido?

  • El humor trata de una sorpresa no seria
  • Los mejores chistes incluyen un "snap" agradable e importante
  • "Snap" se refiere al impacto que proviene de la sorpresa
  • Cuanta menos sorpresa haya, menos gracioso será
  • Esa es la razón por la que, mientras más chistes escuchas, menos graciosos te parecen
  • El humor "random" no da risa porque su imprevisibilidad resulta predecible
  • Escribir chistes consiste en romper patrones
  • El "hacer real una escena" puede reforzar el snap
  • Si usas un lenguaje más original o más descriptivo, la escena se ve más realista
  • Los chistes son diversos y el humor es subjetivo

La predictibilidad de los LLMs

  • Para predecir una oración con éxito, se necesita mucho contexto
  • Los LLMs tienen mucho contexto
  • Los LLMs encuentran el siguiente token más probable mediante una gran cantidad de cálculo matemático
  • Un LLM "mejor" es más predecible
  • Los LLMs no son adecuados para la escritura creativa
  • Los LLMs generan resultados promedio
  • Para generar chistes, un LLM necesita sorprender
  • Un buen LLM no hace eso bien
  • Los LLMs no son adecuados para la expresión artística
  • Los LLMs pueden pasar por alto conceptos interesantes
  • Con este marco sería posible crear nuevos modelos de lenguaje

Por qué esto es interesante

  • Esto apunta a algo más profundo
  • No se trata del debate entre alma y máquina
  • Esto muestra defectos inherentes del modelo
  • Los mensajes de ChatGPT parecen ensayos de preparatoria
  • Esto reproduce una salida promedio
  • A esto se le ha quitado la personalidad y se le ha reforzado con rigor académico
  • Es una voz plana y corporativa
  • Las reseñas falsas de Amazon se pueden identificar fácilmente
  • Los modelos de detección de LLM pronto tendrán que revisar la personalidad

Resumen de GN⁺

  • Este artículo explica las diferencias entre las cadenas de Markov y los LLMs, y explora la naturaleza del humor
  • Las cadenas de Markov son modelos estadísticos simples y tienen menor capacidad de predicción que los LLMs
  • El humor se basa en una sorpresa no seria, y escribir chistes consiste en romper patrones
  • Los LLMs son muy predecibles, por lo que no son adecuados para la escritura creativa
  • Este artículo muestra las limitaciones de los LLMs y plantea la posibilidad de nuevos modelos de lenguaje

1 comentarios

 
GN⁺ 2024-08-19
Opiniones de Hacker News
  • Llegué a la misma conclusión hace unos años mientras hacía un proyecto paralelo

    • Hice un sitio que generaba publicaciones de blog de AWS
    • Usé un generador de cadenas de Markov entrenado con posts de anuncios de AWS
    • Copié el HTML y CSS y los combiné con Python y JS
    • El resultado fue bastante divertido
    • Intenté mejorarlo usando GPT, pero fue menos divertido
    • Los LLM modernos son demasiado realistas, así que tienen menos gracia
    • El humor de los primeros generadores de Markov venía de lo absurdo
    • Los LLM modernos a veces se equivocan, pero no son absurdos
  • Le pedí a Claude 3.5 Sonnet que escribiera 10 chistes cortos sobre por qué las cadenas de Markov son más divertidas que los LLM

    • La razón por la que la cadena de Markov cruzó la calle fue para llegar al otro lado de la imprevisibilidad
    • Cuando un LLM y una cadena de Markov entraron a un bar, el LLM pidió una bebida estadísticamente probable y la cadena de Markov pidió una pantalla de lámpara hecha de queso
    • Si una cadena de Markov hace un chiste de papá, la llamas "Mark-ov Twain"
    • Un LLM pasa 20 minutos explicando la forma óptima de cambiar un foco
    • La cadena de Markov dice "Markov chain reaction of nonsensical hilarity"
    • Cuando un LLM, una cadena de Markov y GPT-4 entraron a un bar, GPT-4 se fue, el LLM se puso a discutir cuestiones éticas y la cadena de Markov pidió una bicicleta hecha de espagueti
    • La película favorita de un LLM es "Predictable and Furious 17: The Safest Driving Yet"
    • La cadena de Markov cuenta una historia sobre "una princesa que vive en un castillo de bananas y un reino de tostadoras con sentimientos"
    • La cadena de Markov le dice al LLM "tu madre es un ábaco y tu padre huele a silicio"
    • La razón por la que la cadena de Markov no sería una buena terapeuta es que aconsejaría "convierte tus emociones en bananas y hazte un sombrero con ellas"
  • No significa que la cadena de Markov sea mejor

    • Un modelo entrenado para predecir no debería ser muy distinto de nuestro motor interno de predicción
    • El problema es acercarse al valle inquietante del texto
  • Cuando estaba en la universidad, unos amigos usaron un generador de cadenas de Markov para la sección de "reportes policiales" del periódico universitario

    • El 10% de los resultados era lo más chistoso
    • Los LLM modernos evitan este tipo de absurdo porque intentan mantener un alto nivel de significado
  • Me incomoda usar la Biblia para este tipo de experimentos

    • Es como usar una imagen de la crucifixión de Jesús en un modelo de edición de imágenes con IA
  • Como evidencia empírica, /r/subreddit simulator es una parodia de Reddit basada en Markov

    • /r/SubSimulatorGPT2 es la versión basada en LLM
    • La versión Markov recibió más upvotes y era más divertida
  • Publiqué varias veces en Reddit "falsos XYZ escritos por IA"

    • El modelo que tuvo mejor respuesta fue GPT-2
    • Las cadenas de Markov no son interesantes por más de una o dos oraciones
    • Los modelos posteriores a GPT-3 son demasiado pulidos y aburridos
    • GPT-2 era más divertido porque, aunque en general respetaba la gramática y mantenía ideas coherentes, le faltaba conocimiento sobre temas específicos
  • Hace unos 10 años, cuando estudiaba, hice un bot de Twitter con Markov

    • Lo entrené con correos de Linus Torvalds en LKML y citas de la Biblia del Rey Jacobo de Jesús
    • Como los dos conjuntos de entrenamiento casi no se solapaban, tuve que añadir histéresis
  • La evolución del blog AI weirdness respalda esta idea

    • Los primeros LLM, especialmente las versiones anteriores a GPT-3, eran más divertidos
    • Por ejemplo, los nombres de cereales generados por la versión Ada de GPT eran más graciosos que los de la versión Da Vinci
  • Tengo dos bots en mi servidor personal de Discord

    • Uno es un bot básico de cadena de Markov entrenado con todo el historial del chat
    • El otro es un bot LLM propiamente dicho
    • El bot de cadena de Markov siempre es más divertido