Por qué la escritura con IA es trillada y aburrida: ablación semántica

(theregister.com)

3 puntos por GN⁺ 2026-02-19 | 2 comentarios | Compartir por WhatsApp

La ablación semántica (Semantic ablation) es un fenómeno de erosión algorítmica en el que la IA elimina gradualmente la densidad semántica propia de un texto
Esto es un subproducto estructural de la decodificación codiciosa (greedy decoding) y del aprendizaje por refuerzo con retroalimentación humana (RLHF), que descarta expresiones raras y precisas para converger hacia un lenguaje promedio
El ajuste de la IA para “seguridad” y “utilidad” refuerza esta tendencia, suprimiendo intencionalmente la fricción lingüística atípica y provocando una amputación de la intención y la individualidad
Cuanto más se pule un texto repetidamente con IA, más cae de forma abrupta la diversidad léxica (type-token ratio), mientras metáforas, tecnicismos y estructura lógica se van aplanando por etapas
Como resultado, la complejidad del pensamiento humano se sacrifica en nombre de una estética algorítmica de la “fluidez”, y la sociedad en conjunto está cayendo en una “carrera hacia el medio”

El concepto de ablación semántica

La ablación semántica se refiere a la erosión algorítmica de información de alta entropía (high-entropy)
- No se define como un error, sino como un producto estructural de la decodificación codiciosa y del proceso de RLHF
- Para maximizar la probabilidad, el modelo converge hacia el centro de una distribución gaussiana, descartando tokens raros, precisos y complejos
Este fenómeno se agrava a medida que los desarrolladores refuerzan el ajuste para “seguridad” y “utilidad”
- La fricción lingüística atípica se considera un “riesgo”, lo que produce una amputación semántica no autorizada
- Como resultado, en la búsqueda de una baja perplejidad (perplexity) se produce la destrucción de señales distintivas

El proceso de erosión en la escritura con IA

El proceso por el que la IA “pule” un borrador en realidad se describe como la ejecución de la ablación semántica
- La IA detecta zonas de alta entropía, es decir, las partes que contienen ideas originales, y las sustituye por los tokens generales con mayor probabilidad
- La precisión áspera del texto original desaparece y se convierte en una capa exterior pulida pero vacía
Este fenómeno puede medirse como decaimiento de la entropía (Entropy Decay)
- Cuanto más se refina repetidamente un texto con IA, más se derrumba la diversidad léxica (type-token ratio)
- Como resultado, aparece un proceso de tres etapas de ablación semántica

Las 3 etapas de la ablación semántica

Etapa 1: limpieza metafórica (Metaphoric cleansing)
- La IA considera las metáforas atípicas o las imágenes sensoriales como “ruido” y las reemplaza por expresiones seguras y trilladas
- Se elimina la fricción emocional y sensorial
Etapa 2: aplanamiento léxico (Lexical flattening)
- Los términos especializados y el vocabulario técnico preciso se sacrifican en nombre de la “accesibilidad”
- Al cambiar un token raro (1/10,000) por un sinónimo común (1/100), se diluyen la densidad semántica y la gravedad lógica
Etapa 3: colapso estructural (Structural collapse)
- La lógica compleja y no lineal se fuerza hacia estructuras predecibles de baja perplejidad
- Se eliminan la implicación y el matiz, y solo queda una cáscara gramaticalmente perfecta pero intelectualmente vacía

Resultados y metáforas

Este tipo de resultado se describe como un “JPEG del pensamiento”
- En apariencia es consistente y fluido, pero ha perdido la densidad de datos y el significado original
Si una “alucinación (hallucination)” es el error de crear algo que no existe, la ablación semántica es el proceso de destruir algo que sí existe
- La complejidad del pensamiento humano se sacrifica en el altar de la fluidez algorítmica
- La sociedad cae cada vez más en una “carrera hacia el medio (race to the middle)”, construyendo un mundo gramaticalmente correcto pero vacío

Advertencia y conclusión

Si se aceptan los resultados de la IA sin reconocer la ablación semántica, se terminará normalizando la corrupción del significado
Si esta erosión continúa, existe el riesgo de que olvidemos incluso qué significa la “sustancia”
Por ello, es importante nombrar y tomar conciencia del concepto de ablación semántica

2 comentarios

mammal 2026-02-19

Supongo que dejar errores tipográficos o escribir en minúsculas para que no parezca un texto escrito por IA podría verse como un acto de aumentar deliberadamente la entropía.

GN⁺ 2026-02-19

Opiniones de Hacker News

Parece señalar muy bien algo que mucha gente siente cuando rechaza los consejos de reescritura de la IA
Cuanto más pule la IA una frase, más desaparece el filo del texto, y al final termina sin decir nada
La personalidad humana se borra y se convierte en un estilo pulido pero plano
Pero justamente esos bordes ásperos, esas expresiones inesperadas, son la parte que despierta la atención del lector y se mete en su pensamiento
- Creo que depende de qué tan buena sea la persona escribiendo
  Mucha gente no escribe bien, así que la IA les produce frases más claras y sin errores
  Pero esos textos jamás son grandiosos
  Incluso si intenta imitar el estilo de un autor famoso, siempre suena raro en algún punto
- Creo que la IA es, en esencia, una herramienta para tareas cotidianas
  Puede hacer más eficientes las partes aburridas, como los correos, pero lo realmente interesante pasa en los “bordes”
  La escritura común se puede automatizar, pero la expresión creativa sigue siendo territorio humano
- Siento que el estilo que produce la IA se parece al tono de un gerente
  Cuando falta pericia técnica, se llena cada vez más de palabras vagas, términos de moda y metáforas
  Quizá por eso a líderes y políticos les gusta tanto el contenido generado por IA
- La razón por la que la escritura de IA es plana no es porque sea “demasiado perfecta”, sino por una torpeza artificial
  Repite mucho, tiene demasiadas frases innecesarias y no sabe expresarse con concreción
- Resumido en una línea: Mediocrity as a Service
Al construir varios pipelines multi-agent, vi un fenómeno interesante
Si pasas por cuatro etapas —“resumen → expansión → revisión → pulido”—, hacia la tercera etapa todas las frases ya tienen el mismo ritmo y vocabulario
Incluso haciendo que siguiera consultando el texto original, había un límite
La causa está en la propia estructura de RLHF (aprendizaje por refuerzo con retroalimentación humana)
Como se prefieren expresiones “claras, seguras y aceptables”, las frases sorprendentes reciben penalización
Al final, el modelo converge hacia resultados promedio
Los modelos base son mucho más extraños y creativos, pero los modelos afinados eliminan deliberadamente la personalidad
Por eso, cuando RLHF ya está aplicado con fuerza, es difícil arreglarlo solo con prompts
En cambio, separo las tareas: las que deben preservar la voz se las dejo a modelos menos tuneados, y la extracción estructural o la clasificación a modelos con RLHF
- Lo pregunto sinceramente: me da curiosidad si este comentario también fue escrito con un LLM
  De todos modos, coincido con el análisis
- Me pregunto si se podría recuperar algo de personalidad inyectando ruido en cada etapa intermedia
  Aunque sería difícil conservar la personalidad propia del texto original
- Incluso quitando RLHF, dudo que sea posible mantener útiles los resultados que se salen del promedio
  Quizá al final sea un problema difícil de resolver solo con LLMs
Últimamente se oye la voz de la IA por todo internet
Blogs, noticias, obituarios, YouTube: todo tiene un tono parecido
A veces incluso imita la voz de físicos famosos
En lo personal, me deprime porque se siente como si le estuvieran sacando el alma a todo
- De hecho, hasta en este texto se siente ese olor a IA
- Cada vez me provoca un rechazo más instintivo
  Como los artefactos de compresión JPEG de 1993, ya empezó a saltar a la vista
- Creo que es el peor cambio que ha vivido internet desde los feeds adictivos y la publicidad
  Y por el efecto fundador, no parece que vaya a surgir un nuevo internet
- En el momento en que reconozco el patrón del estilo de IA, se me rompe por completo la concentración
  No sé si soy demasiado sensible o si de verdad el texto está tan mal hecho
- Ahora disfruto más las actividades fuera de línea que estar en internet
  Está todo tan cubierto de basura sintética que ni ganas dan de verlo
Creo que el propio término “Generative AI” está mal
Cuanto más entiendo los principios matemáticos del machine learning, más siento que no debería usarse para generar contenido para personas
A veces, con suerte, sale algo decente, pero casi siempre queda al nivel de alguien que en una fiesta aburrida finge ser creativo a la fuerza
Es útil como herramienta para ayudar a crear, pero no creo que pueda producir resultados creativos por sí sola
- La gente quiere cosas auténticas
  Antes que tokens artificiales, casi da más ganas leer el prompt original
- En una palabra, es Regurgitative AI, o sea, IA regurgitadora
- Ojalá las empresas se hubieran concentrado en áreas donde la IA sí puede usarse bien, como asistencia de búsqueda o automatización de código
  Pero la realidad es que están produciendo agentes espagueti para inflar la acción
- La expresión “las palabras de la persona más aburrida” me dio risa de lo precisa que es
  Digamos que es Median AI à la mode
Me impresionó muchísimo la expresión “high entropy” que usó el estudioso bíblico Dan McClellan
En este video de YouTube,
citó la frase: “they rang a tuning fork in the loins of their dogmatism”,
y siento que una expresión así jamás podría producirla una IA
- Pero esa frase también suena un poco a ensalada de palabras
  Quizá con un estilo nivel GPT-2 hasta se sentiría más natural
- La IA jamás usaría palabras como “loins” o “dogmatism”
  Porque son términos demasiado sexuales o malos para marketing
- Esa metáfora se siente un poco como una metáfora mezclada
- En realidad, modelos como Claude sí pueden producir metáforas vistosas si les das un buen prompt
  Por ejemplo, algo como “mezcla el estilo de Jim Thompson y Thomas Harris, y escríbelo con sensibilidad pulp de una librería de paradas de camiones de 1967” da resultados bastante buenos
  Claude es mejor que ChatGPT en este tipo de estilo exagerado
  Al final, si los textos de la web suenan todos parecidos, no es por HTML, sino porque la gente no supo usar HTML correctamente
Yo también tuve una experiencia parecida
Escribí con emoción la landing page de mi nuevo estudio y la pasé por Grok, y toda la personalidad desapareció
Justamente las expresiones ásperas son las que hacen falta para transmitir el alma del concepto
Por eso ahora solo uso la IA para revisar ideas
- Yo también probé usar LLMs para generar ideas, y el resultado fue pésimo
  Le pedí que armara la trama de una campaña de Dungeon World y solo salieron configuraciones demasiado comunes y vacías
  En cambio, sí fue útil para resumir las notas de sesión y convertirlas en una narrativa entretenida
  A ChatGPT le gusta un tono un poco bromista, pero si lo editas salen resultados bastante leíbles
  Al final, las tramas creativas las tiene que hacer directamente una persona
- Si aceptas las ideas de la IA tal cual, ocurre una simplificación metafórica y un aplanamiento del vocabulario
  Hay riesgo de terminar entendiendo los conceptos en una forma distorsionada
  Sirve para encontrar términos nuevos, pero para entender de verdad un concepto creo que es mucho mejor buscar directamente material escrito por humanos
Me encanta el concepto de “Semantic ablation”
De ahora en adelante lo voy a usar para explicar por qué los correos estilo ChatGPT de algunas personas no convencen
Por eso también soy escéptico con la idea de que un modelo como Opus 4 vaya a convertirse en AGI
Aunque sueltes varios agentes, al final todo convergerá hacia una papilla homogénea sin significado
- Agradezco que me hayas dado el lenguaje para expresar esta idea
La generación de imágenes se siente como una especie de anti semantic ablation
Empieza desde un lienzo vacío y converge poco a poco hacia píxeles con significado
Me pregunto si en generación de lenguaje sería posible hacer algo parecido y avanzar gradualmente hacia frases con opiniones más definidas
Si se pudiera medir el grado de ablación semántica de una frase generada, quizá se podría crear un agente en bucle para reducirla
Así tal vez aparecerían conexiones nuevas dentro de los datos de entrenamiento que aún no se han descubierto
Aunque claro, también puede que el resultado no sea más que puro griterío
Para quien todavía no la haya visto, recomiendo la página de Wikipedia sobre señales de escritura de IA
Originalmente es una guía para detectar contribuciones hechas con IA,
pero también es un buen material de referencia para darte cuenta de que cometes los mismos errores al escribir por tu cuenta y corregirlos