Los “olores a IA” creados por los LLM
(shvbsle.in)- La escritura asistida por LLM al principio mejoraba el vocabulario y la estructura de las oraciones, por lo que no se sentía como texto de baja calidad hecho por IA, pero unos meses después las mismas huellas empezaron a repetirse por todo internet
- En los textos escritos por LLM aparecen patrones de estilo repetitivos, como un exceso de frases lapidarias de una sola línea, series de oraciones cortas consecutivas y construcciones del tipo "X es la Y de Z"
- En los sitios web generados por IA también se repiten elementos de UI visualmente similares, como la fuente JetBrains Mono, el mismo layout de pasos y viñetas, ciertos diseños de botones y tarjetas, y puntos parpadeantes en badges
- El punto central no es oponerse al uso de LLM/IA en la creación, sino reunir y observar los patrones que se detectan repetidamente en la escritura y en los sitios web
El "olor a IA" en la escritura con LLM
- A finales del año pasado, cuando se usó un LLM para pulir una entrada de blog sobre matemáticas, mejoró el vocabulario y la estructura de las oraciones, así que no se sentía como texto barato generado por IA
- Unos 3 meses después, la misma estructura de oraciones empezó a aparecer repetidamente por todo internet, y comenzó a sentirse como una huella reconocible del trabajo asistido por IA en general
- Además del abuso del em dash, se repiten con frecuencia los tres patrones de estilo siguientes
Patrones repetitivos visibles en la escritura y en los sitios web
-
Exceso de frases lapidarias de una sola línea (Punchlines)
- Aparecen demasiadas oraciones declarativas, cortas e impactantes
- "Humans trust symmetry because it feels like intelligence made visible."
"Los humanos confían en la simetría porque se siente como la inteligencia hecha visible." - "The Tiger fit the story. Jin-yong fit the physics."
"Tiger encajaba en la historia. Jin-yong encajaba en la física." - "Symmetry becomes a trap."
"La simetría se convierte en una trampa."
- "Humans trust symmetry because it feels like intelligence made visible."
- Aparecen demasiadas oraciones declarativas, cortas e impactantes
-
Oraciones cortas consecutivas
- Se repite la estructura de enumerar varias oraciones breves seguidas
- "Yet the tilt is not an accident. It is the shape of the optimum."
"Sin embargo, esa inclinación no es un accidente. Es la forma del óptimo." - "Then AlphaEvolve arrived. It had no preference for symmetry. No aesthetic prior. No instinct to preserve harmony."
"Entonces llegó AlphaEvolve. No tenía preferencia por la simetría. Ningún prior estético. Ningún instinto de preservar la armonía." - "These examples are not decorative. They form a distributed argument."
"Estos ejemplos no son decorativos. Forman un argumento distribuido."
- "Yet the tilt is not an accident. It is the shape of the optimum."
- Se repite la estructura de enumerar varias oraciones breves seguidas
-
Formato "X es la Y de Z"
- Un patrón fijo que define metafóricamente cierto concepto
- "Cringe is the visible signature of moving along a gradient you chose."
"El cringe es la señal visible de avanzar por un gradiente que elegiste."
- "Cringe is the visible signature of moving along a gradient you chose."
- Un patrón fijo que define metafóricamente cierto concepto
-
Formato "no es simplemente X, sino Y"
- Una estructura de frase que enfatiza mediante el contraste
- "solutions that do not merely satisfy the constraint but satisfy the aesthetic instincts"
"soluciones que no solo satisfacen la restricción, sino también los instintos estéticos"
- "solutions that do not merely satisfy the constraint but satisfy the aesthetic instincts"
- Una estructura de frase que enfatiza mediante el contraste
El "olor a IA" en los sitios web generados por IA
- No solo en la escritura, también en el diseño de sitios web generados por IA aparecen repetidamente patrones visuales homogeneizados
-
Fuente JetBrains Mono
- En muchas páginas web generadas por IA se usa en común la fuente JetBrains Mono
-
El mismo layout de pasos y viñetas
- Junto con esa fuente, también se repite casi exactamente el mismo layout de pasos (step) y listas con viñetas
-
Diseño de botones y tarjetas
- Cierto estilo de botones y diseño de componentes de tarjetas aparece igual en varios sitios
-
Punto parpadeante en los badges (Blinking Dot)
- El punto parpadeante (blinking dot) dentro de componentes de badge se identifica como otro elemento de UI que reaparece una y otra vez
- Nota al pie: la postura no es oponerse al uso de LLM/IA en el trabajo creativo, sino más bien una observación que reúne patrones detectados de forma repetida
3 comentarios
Estoy creando algo de código abierto relacionado con esto. Este tipo de artículos también sirven mucho como referencia.
https://github.com/devswha/patina
Estoy de acuerdo.
He sentido que los textos escritos por IA son difíciles de leer, como cuando uno evita de forma natural los banners publicitarios.
Comentarios de Hacker News
Los LLM tienden a parecer especialmente buenos cuando hacen cosas que yo no puedo hacer. Si siento que la salida de un LLM es mucho mejor que la mía en un área específica, hay una alta probabilidad de que me falte la capacidad para juzgar bien esa calidad
Un lado dice: “la IA produce código que yo jamás podría escribir, termina de una vez tareas que me tomarían días y multiplicó mi productividad por 10”; el otro dice: “la IA sigue produciendo código pésimo, requiere rehacer trabajo, comete errores y hay que vigilarla, y al final me hace perder tiempo”. Si la salida del mismo producto se ve tan distinta, hay malas noticias para el primer bando
En cambio, casi no escribo código y solo lo hice profesionalmente una vez, pero cuando Claude escupe código en segundos siento que soy un superhumano y que pronto seré multimillonario. Luego recuerdo que Claude ni siquiera puede escribir texto legible, y que yo escribo bien pero programo mal, así que borro el código y vuelvo a hacer algo que me deja más dinero
Creo que no habría dicho esto hace un año. Todavía hay que vigilarlos como halcón porque lanzan tonterías plausibles de formas que incluso a un experto le cuesta detectar, pero los dados internos se están inclinando cada vez más hacia lo correcto y útil que hacia lo equivocado o inútil
Un libro al mes ni siquiera es una meta tan alta. No hace falta irse hasta Melville, Hemingway, Chaucer o Shakespeare; basta con agarrar cualquier best seller del NYT y será muchísimo mejor que cualquier texto que pueda generar un LLM
Los LLM prefieren estilos codificados, tipo “libro de texto/manual técnico”, probablemente porque así resultan más útiles para los humanos. Pero escribir bien no es solo producir la oración más elegante; a veces un gran texto también puede ser algo como este meme de dibujo de perrito: https://knowyourmeme.com/photos/2160304-the-winner-of-this-c...
Expresiones como “honest caveat:”, “genuine caveat:”, “honest answer:”, “The thing to internalize:”, “The smoking gun:” se sienten como una fuerte señal de LLM
En especial las oraciones que empiezan con “The ___:”; también “load bearing” cuando no se está hablando de arquitectura, “blast radius” cuando no se habla de explosiones reales, usar “smoke test” donde “sanity check” sería más correcto, las listas de tres elementos donde el tercero solo combina los dos anteriores, llamar metafóricamente a las cosas “shape”, las publicaciones sociales que terminan con “Curious if anyone...”, y también usar “Oh. Oh.” en una anécdota, con el segundo Oh en cursiva. Algunas son expresiones que los desarrolladores sí usan de verdad, pero vale la pena examinar su frecuencia real de uso, y estos rastros siguen apareciendo en la prosa de los modelos más recientes
En particular, load bearing era una expresión bastante común en conversaciones cotidianas de operaciones. Pero nunca he visto que “smoke test” se use en la vida real
Los patrones recopilados por Wikipedia también están bien documentados: https://en.wikipedia.org/wiki/Wikipedia:Signs_of_AI_writing
Todo termina siendo un escape hatch. Un try/catch es un escape hatch, un flag de CLI es un escape hatch. No tiene sentido, y al final terminó en mi archivo Markdown de “palabras y frases prohibidas”
La uniformidad de la escritura con LLM es mala. Está bien usar un LLM para ayudar a escribir, pero conviene no meter en el texto final ni una sola palabra generada por el LLM, ni siquiera con un ajuste de vocabulario
Sí sirve pedirle que critique la estructura y el flujo, y que detecte palabras excesivamente repetidas, voz pasiva y elecciones torpes de oraciones temáticas. Eso mejora el texto de forma objetiva sin arruinar el estilo
En cambio, la uniformidad de los LLM en diseño web sí es buena. La mayoría de los sitios no necesitan esforzarse por ser raros. El buen diseño de un sitio práctico es la legibilidad, y el LLM lo hace mejor que el desarrollador promedio. Está bien seguir usando la misma disposición de botones y el mismo sistema de tamaños de letra. Si a mí me parece que se ve bien, probablemente quedó mejor que si lo hubiera hecho solo, y si lo hubiera hecho solo, probablemente habría quedado peor
GPT-5.x es especialmente grave en eso. Por ejemplo, si le pides un dashboard, mete montones de números y fragmentos de texto aquí y allá, y la mayoría básicamente repite lo mismo dos veces. Claro, esto probablemente no sea un problema esencial de la estructura en sí, sino algo que pronto podría corregirse, y si preparas primero todo el texto antes de hacer el sitio, puede salir un buen resultado
Usar LLM para escribir se siente muy raro en muchos casos. Tal vez llenar formularios tontos sea una excepción. He visto a colaboradores usar LLM para documentación técnica, y casi siempre era palabrería al borde del sinsentido con una estética de sonar correcto. Si usas mucho LLM en escritura creativa, se siente como si el propósito mismo desapareciera
Todavía no lo he usado para revisar mi escritura, pero tengo curiosidad por saber si realmente funciona tan bien
Cuando imagino a alguien escribiendo algo importante para o sobre una persona que ama, y metiendo entre medio esas frases azucaradas y basura que le sugirieron, me da vergüenza ajena. Es puro sinsentido, y una señal enorme de que no le importa lo suficiente su audiencia como para aportar sus propias palabras
Tampoco hay que olvidar la negación contrastiva
Es una estructura retórica donde se niega una idea en la primera parte de la oración y se afirma una alternativa en la segunda. Suele aparecer en fórmulas como “no es X, es Y” o “no es solo X, es Y”
También hay un buen recurso en Wikipedia sobre patrones comunes de escritura con LLM: https://en.wikipedia.org/wiki/Wikipedia:Signs_of_AI_writing
Sobre todo me gusta esa perspectiva de que el problema no son esos patrones en sí. No basta con corregir los patrones; el problema es que esos patrones apuntan a contenido escrito a la rápida o con descuido
Estructuras como “No ___, no ____. Just _____”, o usar “honest” al explicar un enfoque, también delatan mucho
Ya es tanto que estoy pensando en un gancho para que un subagente meta verificación de hechos tipo “¿de verdad estás seguro?”. La falsa distinción de “no es X, es Y” se usa de forma parecida. Por ejemplo, cuando un autodenominado ciudadano soberano dice que “no está conduciendo, sino desplazándose en un automóvil”
También aparece en positivo. Algo como “Smooth. Effortless. A perfect fit for your needs.”. Sale una y otra vez en escritura informal o persuasiva, como si hubiera que clavar la idea principal a golpes
Da un poco de pena seguir diciendo en público cuáles son esas señales. Era bueno poder detectarlo con bastante precisión, aunque supongo que no iba a durar para siempre
Lo interesante es que no siento que el estilo de los LLM haya mejorado mucho últimamente
Hace tiempo ya llegaron a un nivel “decente”, pero los modelos más nuevos no han traído mejoras al punto de que se prefieran por encima de escritores humanos profesionales. Me pregunto si otras áreas también terminarán así en la carrera por la superinteligencia
Ahora, en la mayoría de los textos como posts de blog o mensajes de Slack, prefiero ver escritura más cruda, más humana, aunque tenga algunos errores ortográficos o gramaticales
Los LLM son excelentes para generar ideas, escribir código y quizá pulir texto, pero ojalá no escribieran textos completos en tu lugar. En ese tipo de escritura, quiero escuchar lo que tú tienes que decir, no lo que diga la IA
Si en tu empresa puedes usar Claude y no pasa nada con mostrarle tus correos, vale la pena probar con “lee todos los emails que he enviado y crea una skill para redactar borradores de correo con mi voz”
Aunque no uses realmente esa skill, leer el archivo de skill generado es divertido. Se siente extraño, como preguntarle a Claude “¿quién soy yo?”
No lo he probado con mensajes de Slack, porque da un poco de miedo leer eso. Aun así, aplicaría el mismo concepto
En la empresa hay algunas personas que usan Claude activamente para escribir mensajes de Slack, y se nota fácil cuando hasta cierto día escribían un inglés apenas comprensible repartido en varios mensajes, y al día siguiente empezaron a mandar una sola pieza de prosa perfectamente consistente
En la práctica funciona bastante bien
Últimamente da risa bajar por el feed de LinkedIn
Mi favorita de hoy fue “Los impuestos no son el problema. La mentalidad es el problema.”
Al ver que hablaban de la fuente “JetBrains Mono”, di por hecho que saldría la crítica al abuso de Inter. Aun así, JetBrains Mono es una gran fuente
Si JetBrains Mono sirve para el trabajo, entonces hay que usarla; no hace falta evitarla solo porque la IA la use seguido
Me da curiosidad si legalmente se puede usar en cualquier sitio web