1 puntos por GN⁺ 4 시간 전 | 1 comentarios | Compartir por WhatsApp
  • La escritura con LLM se ha expandido a blogs, redes sociales, periódicos, libros, correctores ortográficos y redacción de borradores, y su estilo repetitivo hace que los textos parezcan una masa homogénea de slop
  • Los lectores esperan que, así como ellos dedican tiempo a leer, el autor también haya puesto esfuerzo intelectual, y el uso de LLM sacude esa expectativa independientemente de la calidad del resultado
  • Oxide RFD 576 sostiene que la creencia de que el autor entendió y escribió por sí mismo justifica el esfuerzo del lector por comprender, y que la prosa de LLM daña ese contrato social
  • Desde ChatGPT, el texto generado influye en el habla y la escritura humanas incluso sin escribirlo directamente, algo visible en el aumento del uso de palabras como “delve”, “realm” y “meticulous”
  • El criterio de buena escritura se desplaza de la perfección gramatical y léxica hacia la expresión original y las huellas humanas, y hasta los errores tipográficos pueden volverse una señal que distingue al texto de IA

La escritura con LLM y el contrato social

  • Los LLM se han extendido a muchas industrias, pero sobre todo a la escritura, donde se usan ampliamente en blogs, redes sociales, periódicos, libros, corrección ortográfica, gramática, verificación de datos y redacción completa de borradores
  • Son fuertes para producir grandes volúmenes de contenido, pero una vez que empiezas a reconocer los modismos y patrones de estilo propios de los LLM, esa misma sensación se repite por todos lados
  • Expresiones como “it’s not x, it’s why”, el guion largo y frases como “you’re not imagining it, the problem is real” se repiten, y los textos se van homogeneizando cada vez más en el mismo slop
  • En el momento en que el lector descubre que el autor no dedicó un tiempo equivalente al que él invirtió en leer, siente un rechazo fuerte
  • Ese rechazo no desaparece aunque el contenido sea correcto, esté bien investigado y el texto en sí esté razonablemente bien

El planteamiento de Oxide RFD 576

  • La sección 2.4, “LLMs as writers”, de Oxide RFD 576 sostiene que la prosa generada por LLM daña el contrato social de la escritura
  • Cuando no existían los LLM, se asumía que, entre lector y autor, el autor había hecho un mayor esfuerzo intelectual
  • El lector encuentra una razón para esforzarse en comprender ideas y frases difíciles cuando puede creer que el autor entendió por sí mismo aquello que escribió
  • Cuando se escribe con LLM, al margen de la calidad del texto o de la precisión del contenido, disminuye el esfuerzo que el autor invierte para crear ese contenido
  • El problema central no es solo la calidad del resultado, sino que el acto mismo de usar un LLM en lugar de escribir directamente rompe el contrato social

La influencia difícil de evitar del texto generado

  • Incluso sin usar directamente un LLM, el torrente de texto generado influye en la forma en que los humanos hablan y escriben
  • Expresiones como “you’re absolutely right” se usan para burlarse de los LLM, pero la herramienta en sí también está cambiando sutilmente los hábitos lingüísticos humanos
  • Un estudio del Max-Planck Institute for Human Development analiza que las palabras preferidas por ChatGPT también empezaron a usarse con más frecuencia en el habla cotidiana de las personas
  • Entre las palabras cuyo uso aumentó están delve, realm, meticulous, adept, boast, swift, comprehend
  • Los resultados de la IA generativa ya se han extendido por todo el entorno lingüístico, se usen o no de forma directa

La analogía con el acero de bajo fondo radiactivo

  • El low-background steel se refiere al acero producido antes de las primeras detonaciones de bombas atómicas, un material que durante un tiempo fue más buscado para ciertos usos
  • Varias pruebas nucleares de las décadas de 1940 y 1950 aumentaron las sustancias radiactivas en la atmósfera, y el acero producido después pasó a considerarse no lo suficientemente “limpio” para algunas aplicaciones, como los detectores de partículas
  • Aun así, hoy parece que la radiación de fondo artificial global ha bajado lo suficiente como para que el acero producido recientemente pueda usarse en la mayoría de los casos
  • En esta analogía, los textos escritos después del 30 de noviembre de 2022 se consideran influidos en cierta medida por los LLM, porque fueron escritos tras la expansión de ChatGPT
  • Salvo que uno se limite a leer solo contenido antiguo, es difícil evitar por completo el entorno lingüístico posterior a los LLM

Los criterios de escritura después de los LLM

  • Cuanto más contenido generado ocupe internet, mayor será la demanda de pensamiento y expresión originales, tanto en individuos como en empresas de modelos
  • La capacidad de escribir contenido original sin LLM podría volverse más valiosa
  • Pero en un entorno saturado de textos tipo thought leadership de LinkedIn e imágenes de gatos generadas por IA, encontrar ese tipo de escritura se vuelve más difícil
  • Durante mucho tiempo, los humanos han considerado que una buena gramática, un vocabulario amplio, expresiones y metáforas adecuadas, y una estructura sólida eran criterios de buena escritura
  • Los LLM cumplen en general con esos criterios tradicionales, pero repiten los mismos patrones, sus expresiones parecen gastadas, sus metáforas desentonan un poco y el guion largo deja una mala impresión

El cambio en los criterios de buena escritura

  • Hoy un estudiante puede elegir entre esforzarse para obtener una nota promedio o no hacer nada y sacar una nota alta con una tarea escrita por ChatGPT
  • Es posible pensar que, si se mostrara hoy un texto escrito por Claude a una persona de hace 10 años, no encontraría demasiados motivos de queja
  • Los textos de LLM revelan su repetitividad cuando se leen durante mucho tiempo, pero encajan bastante bien con los criterios tradicionales de escritura “correcta”
  • Ahora el valor más importante se desplaza hacia la expresión original
  • Aunque la gramática sea incorrecta, si es diferente puede tener valor; y aunque el vocabulario sea limitado, si evita las palabras repetitivas típicas de los LLM, se siente más humano
  • Los errores tipográficos ya no pueden verse solo como defectos, sino como una huella humana que distingue el texto de la IA, plana y generalizada

La promesa de escribir sin LLM

  • Para que exista un contrato social, el autor debe dedicar tiempo a escribir en proporción al tiempo que el lector dedica a leer
  • Un texto escrito tras pasar buena parte del día en ello, con una película vieja de fondo, contiene un esfuerzo que corresponde al tiempo de quien lo lee
  • Escribir es una actividad placentera y algo que se ha hecho toda la vida, aunque con distintos niveles de constancia
  • Existe la intención de convertir la escritura en una rutina más cotidiana, y de considerar ese acto como algo significativo y que vale la pena

1 comentarios

 
GN⁺ 4 시간 전
Opiniones en Lobste.rs
  • Esta frase del RFD de Oxide parece una versión menos mordaz y menos citable del común meme ai;dr, pero mucho más explícita
    Decir que “cuando no hay LLM, se asume que entre el lector y el autor, el autor puso un mayor esfuerzo intelectual” al final significa “si tú no hiciste el esfuerzo de escribirlo, yo tampoco haré el esfuerzo de leerlo”

  • Los autores que meten LLM en su trabajo no transmiten experiencia
    Todo ese olor a LLM se siente como si estuvieran gritando “soy un mediocre que no piensa hacer su trabajo”. En software se puede argumentar que los resultados consistentes, predecibles, aburridos y de baja varianza son buenos, pero en escritura creo que por lo general es lo contrario

    • Me pregunto qué parte de eso es desesperación por no quedarse atrás mientras todos los demás producen contenido en masa, y qué parte es ceder a la tentación de delegar todo el trabajo y la responsabilidad
    • No estoy muy de acuerdo con eso de que “en software los resultados consistentes, predecibles, aburridos y de baja varianza pueden ser buenos, pero en escritura es al revés”
      De hecho, creo que necesitamos más escritura consistente, predecible y aburrida. La mayoría de los consejos de escritura priorizan el estilo por encima de la claridad y la verdad. No es que quiera defender la escritura con IA, ni la use yo mismo para escribir, y también detesto ese olor, pero ojalá más autores humanos tuvieran el valor de volverse aburridos
    • ¿Y si asumimos que los lectores más probables son los propios LLM?
  • Con los pull requests pasa lo mismo. Antes, la mayor parte del esfuerzo iba en pensar profundamente el problema y escribir el código
    La revisión también podía dar mucho trabajo, pero al menos había equilibrio, y si no lo había era porque la revisión también servía al mismo tiempo para onboarding o formación. Si te importa la calidad del proyecto, ahora la ecuación cambió por completo. Gente sin ningún interés en el proyecto puede lanzar PR a una velocidad varios órdenes de magnitud mayor que la que se puede revisar
    Qué horror, en serio. En revisión de código todavía existe la ventaja de que puedes bloquear los PR de contribuyentes nuevos con sistemas como vouch. Pero en el caso de cosas como entradas de blog, uno termina dudando constantemente si el autor realmente entendió y le importó lo que escribió, o si solo se topó con otro muro de slop. Por ahora el slop todavía se reconoce con facilidad, pero eso probablemente cambie cuando los productores empiecen a indicarle a los modelos que eviten los patrones típicos. El único slop que me da gusto ver es que LinkedIn esté inundado de comentarios slop

    • En realidad no tuvo ningún efecto sobre la calidad promedio de las publicaciones en LinkedIn
      Antes ya era basura de autopromoción, y después sigue siendo basura de autopromoción. Solo que ahora además trae imágenes de IA estilo caricatura
    • Con cosas como entradas de blog, empecé a poner la URL en Wayback Machine para verificar cuándo se creó por primera vez
      Básicamente, todo lo creado antes de 2022 me parece mucho menos sospechoso. La gente que sabe también está usando before:2022 en las búsquedas de imágenes
  • Al leer una entrada de blog, el contrato social más importante es que el autor va a seguir mejorando su escritura a través de esa experiencia
    El uso de LLM también rompe eso. Podemos debatir el uso de LLM para escribir código, pero usarlos para escribir blogs, en particular, simplemente me parece repugnante

  • Expresó muy bien pensamientos y emociones que he tenido desde hace tiempo. Sobre todo ese deseo de la imperfección del toque humano
    Quiero eso en los demás, y también quiero que mi humanidad se note en mi propio trabajo. Soy muy malo con la ortografía, así que mis amigos y colegas se burlan seguido de mí, y más de una vez he pensado seriamente en dejar algunos errores a propósito cuando escribo una entrada de blog para mostrar que sigo siendo humano. Claro, quizá eso ya sería pasarse

  • Me identifico totalmente con eso de “disfruto escribir, lo he hecho toda la vida, y ahora quiero intentar hacerlo de una forma más rutinaria. Se siente como algo significativo y que vale la pena”, pero tengo dos miedos
    Primero, cuando veo que alguien empezó un blog por casualidad alrededor de 2024/2025 o comenzó a publicar más por esa época, por defecto lo clasifico y archivo como IA. Mi propio blog, visto desde afuera, probablemente se vea así. Segundo, no me entusiasma que mis textos ayuden a las empresas de IA a construir mejores modelos. Aunque, de forma hipócrita, yo también uso IA todos los días
    En cuanto al segundo problema, no veo una buena forma de matar a tantos Goliat. Respecto al primero, ojalá aparezca algún tipo de prueba de trabajo humano que demuestre que hubo suficiente atención humana detrás del contenido. Pensé incluso en hacer stream por Twitch mientras escribo, pero es demasiado poco realista, y además me daría vergüenza mostrar el proceso de escritura, incluyendo ideas tontas, darme cuenta de que “lo que estoy escribiendo está completamente mal” y la interminable reformulación para ajustarlo a mi gusto. No se me ocurre otra forma de demostrarlo

  • Ahora mismo estoy escribiendo una entrada técnica de blog bastante compleja, y todas las oraciones del cuerpo las estoy redactando yo mismo a mano
    Me tomó varios intentos aterrizar lo que quería decir, pero ahora la estructura ya me parece bastante buena. La parte en la que usé Claude como herramienta fue para convertir explicaciones en texto a diagramas Mermaid. Agradezco el esfuerzo invertido en Mermaid, pero siento que parte de la sintaxis es demasiado críptica, sobre todo cuando uno se sale de estructuras estándar como los flowcharts o los diagramas de secuencia. Trabajo en Oxide y también di mi opinión hasta cierto punto sobre el RFD 576