Las cuentas nuevas de HN tienen 10 veces más probabilidades de usar EM dash

(marginalia.nu)

1 puntos por GN⁺ 2026-02-26 | 1 comentarios | Compartir por WhatsApp

Un análisis reciente de los patrones de comentarios de las cuentas nuevas de Hacker News confirmó diferencias claras frente a los usuarios existentes
Entre los comentarios de cuentas nuevas, 17.47% usó EM dash (—), flechas y otros símbolos especiales, unas 10 veces más que el 1.83% de las cuentas existentes
Además, las cuentas nuevas mostraron una probabilidad de 18.67% de mencionar palabras relacionadas con AI y LLM, más alta que el 11.8% de las cuentas existentes
El análisis comparó muestras de alrededor de 700 comentarios por grupo con base en datos de /newcomments y /noobcomments
Estas estadísticas sugieren la posible proliferación de cuentas automatizadas (bots) dentro de la comunidad de HN

Observación de señales inusuales en los comentarios de HN

En los últimos meses se ha observado un fenómeno en el que parece haber aumentado drásticamente la cantidad de bots en HN
- Algunas cuentas publican solo cadenas sin sentido o números
- Entre los ejemplos aparecen textos crípticos como “13 60 well and t6ctctfuvuh7hguhuig8h88gd…”, o comentarios de un solo carácter como “1662476506” y “Аё”
Además de esas cuentas, también hay muchos comentarios normales en apariencia, pero extraños o fuera de tema

Método de recolección y análisis de datos

Se hizo un análisis comparativo mediante scraping de las páginas /newcomments (comentarios recientes) y /noobcomments (comentarios de cuentas nuevas)
Se recopilaron aproximadamente 700 muestras de comentarios de cada grupo y se calcularon estadísticas simples

Resultados estadísticos principales

17.47% de los comentarios de cuentas nuevas incluía EM dash, flechas u otros símbolos especiales, frente a 1.83% en las cuentas existentes, una diferencia de unas 10 veces
- Significancia estadística: p = 7e-20
18.67% de los comentarios de cuentas nuevas incluía menciones relacionadas con AI o LLM, por encima del 11.8% de las cuentas existentes
- Significancia estadística: p = 0.0018

Interpretación y dudas

Los usuarios humanos también pueden usar EM dash, pero es difícil explicar una proporción de uso tan alta en cuentas nuevas
Esta diferencia sugiere la posibilidad de que entre las cuentas nuevas de HN existan cuentas generadas automáticamente

Material de referencia

El código fuente y los datos usados en el análisis están publicados en el repositorio de GitHub (vlofgren/hn-green-clankers)
Marginalia.nu publicó este estudio como parte de la serie “Weird AI Crap”

1 comentarios

GN⁺ 2026-02-26

Opiniones de Hacker News

Antes se usaban mucho los em dash y en dash en HN
Simplemente me gustaba la tipografía, así que tenía la costumbre de usar guiones en lugar de punto y coma
Había configurado un atajo de teclado con AHK, pero ahora, por eso, mis textos dan la impresión equivocada de que fueron escritos por un LLM
Ya me han confundido varias veces con IA, así que me da pena que una preferencia tipográfica que antes disfrutaba ahora se vea de forma negativa
- Mi hijo adolescente incluso me preguntó por qué escribo como un chatbot
  En realidad, solo hay gente que se preocupa por escribir con oraciones completas, ortografía, gramática y mayúsculas, pero ahora eso parece IA
  Últimamente parece que escribir un poco desordenado a propósito se volvió una señal de humanidad. Supongo que los chatbots del futuro también aprenderán eso
- Si quitar la Oxford comma fue una broma intencional, te mando elogios y maldiciones al mismo tiempo
- Yo también era fan del em-dash, pero últimamente lo reemplazo con comas
  Las oraciones quedan un poco raras, pero me gusta porque se sienten artesanales y auténticas
  Eso sí, jamás voy a renunciar a los dos espacios al final de la oración. Mi maestra de mecanografía de 1993 decía que las oraciones también necesitan espacio para respirar
- Qué triste que la crisis de alfabetización esté así de grave, y que los chatbots sean el único profesor de redacción
- Yo tengo un problema parecido, pero en mi caso es por los bullet points
  Desde siempre tengo la costumbre de escribirlos en Mac con option+8, pero ahora hasta eso parece estilo de LLM
Compararon estadísticamente las palabras más usadas en comentarios de usuarios nuevos de HN
Palabras como “ai”, “actually”, “code”, “real” y “built” aparecen mucho más seguido en cuentas nuevas
Está todo detallado en la tabla de datos
- Considerar algo significativo solo por mirar el p-value entre muchas métricas es p-hacking
  Académicamente no es correcto, pero aquí puede verse como una observación interesante
  En cambio, si se calcula un tamaño del efecto como Cohen’s d, se puede entender la magnitud real de la diferencia
- También hubo un comentario de broma encadenando palabras tipo “actually building full, real AI app project code…”
- Yo también uso demasiado “actually” y estoy tratando de reducirlo
  Casi siempre es una muletilla sin sentido que le quita claridad al texto
- Es posible que la palabra “ai” haya sesgado el resultado por la inclinación temática reciente de HN
- Un p-value tan bajo parece señal de que algo raro pasa
  Se planteó la hipótesis de que algunos bots están inflando artificialmente temas relacionados con IA
Siempre me gustó usar em-dash, pero ahora me da pena no poder usarlo por miedo a que me confundan con IA
En Mac se escribe fácil con alt+shift+-, y se siente como si una buena práctica tipográfica se hubiera contaminado
- La fatiga por los LLM es real. Lo importante no es el estilo, sino la perspectiva y personalidad propias de una persona
  Si eso está presente, cualquier puntuación sigue sonando humana
- Simplemente sigue usándolo. Yo llevo 20 años haciéndolo
- Ahora lo reemplazo por punto y coma. Me da miedo que algún día eso también se vuelva símbolo de IA
- Uso em-dash desde 2010, y también me gustan las curly quotes y los ellipsis
  Comparto esta guía de códigos Alt para Mac con la idea de recuperar la tipografía
- No importa lo que diga la gente. Incluso podría ser que el LLM haya aprendido a escribir con mis textos
  Al final, la forma única de expresarse de una persona termina notándose
Los datos están publicados como una base SQLite en este repositorio de GitHub
También se pueden ejecutar consultas SQL directamente en el navegador con Datasette Lite
Al ver la lista de usuarios que más usan em-dash, la mayoría parecen cuentas normales
- Si agregas source a la consulta, destacan varias cuentas green con mucho uso de em-dash
- La autocorrección en iPhone, iPad y Mac a veces inserta automáticamente em-dash o ellipsis, así que eso puede sesgar los datos
- También hubo un chiste preguntando si “los comentarios de HN están licenciados no solo para HN, sino también para algún sueco”
- También hubo un elogio breve: “great repo name!”
Esto ya no parece un problema solo de HN, sino una crisis del discurso anónimo en línea en general
Si la confianza se rompe, la plataforma misma se derrumba
La verificación de identidad parece la única solución, aunque tampoco sería perfecta
- Pienso lo mismo. Se puede crear un sistema que garantice confianza manteniendo el anonimato
  Presenté esa idea en mi post del blog
  Parece que se acerca una era en la que habrá que demostrar que uno es humano
- Eliminar el anonimato no es una solución, sino el comienzo de otro problema
- En lugar de identidad, la confianza también podría validarse con proof-of-work o hashcash
  Si el valor de un comentario se demuestra por la cantidad de hash computado, se puede confiar sin necesidad de identidad
- Últimamente ya no me dan ganas de usar HN. Ojalá volviera a ser por invitación. HN tenía un espacio propio y da pena perderlo
- El sistema de karma de HN también es una forma de proof-of-work
  Si un bot no puede mantener karma positivo, no obtiene privilegios, así que se puede defender la plataforma sin verificación de identidad total
Últimamente se nota en HN un patrón de comentarios formales pero insípidos
Se repite una estructura tipo “this is [resumen] / not just x, it’s y / punchy ending”
Se ve claramente, por ejemplo, en la cuenta snowhale
- Ese usuario consiguió 160 puntos con solo 4 publicaciones insípidas
  Podría ser una estrategia para armar una red de votos y manipular la narrativa
- La expresión “is real” también parece una huella de LLM
  En estos resultados de búsqueda, varias cuentas repiten la misma frase
- Yo también veo seguido ese tipo de comentarios-resumen
  Muchas respuestas no leen el contexto de la conversación y se sienten extrañamente desconectadas
- La IA también termina haciendo juicios de valor sesgados
  Igual que los humanos, aparenta neutralidad, pero lleva dentro los sesgos de sus datos de entrenamiento
  Tal vez la neutralidad total sea una ilusión
- En realidad, evitar ese patrón es fácil
  Si al prompt le agregas “habla como yo, no escribas como IA, sé conciso”, la mitad del problema se resuelve
Irónicamente, gracias a esta polémica mucha gente conoció por primera vez la existencia del em-dash
Ahora incluso aumentó bastante la cantidad de nuevos usuarios humanos que ponen em-dash en cada oración
La mayoría de las cuentas bot que detecté casi no usan em-dash
Por ejemplo, aplomb1026 publicó dos comentarios largos con 30 segundos de diferencia
Se nota claramente al ver el primer comentario y el segundo comentario
Si no hubiera cometido ese error de configuración, probablemente casi nadie se habría dado cuenta
Otros bots son dirtytoken7 y fdefitte
La gente que estudió literatura inglesa lleva mucho tiempo usando em-dash, pero ahora se están conteniendo por miedo a parecer IA
Si la IA empieza a usar hasta la diéresis al estilo New Yorker, creo que me voy a volver loco
- Cuando trabajaba en GitHub, la empresa prohibía la diéresis por considerarla poco amigable para el lector y elitista
  Aun así, yo seguí usándola internamente
- Propusieron que nos unamos para defender la estética de lo tecleado a mano con double-dash
- Yo también usaba mucho em-dash en correos y textos, pero lo dejé porque parecía marca de IA
- No sabía que existía ese signo, pero ahora pienso sumarlo a mi repertorio expresivo
- También hubo quien quiso ver un histograma de cuánto uso em-dash
¿Y si, en vez de “no parecer IA”, uno decide “mezclarse con la rebelión robótica”?
Yo propongo ⸻ (guion U+2E3B)
- Hubo un reporte de que este comentario rompe la navegación anterior/siguiente de HN
- También bromearon llamándolo “Big Chungus of dashes”, diciendo que quizá sea el carácter más ancho de todos
- Hubo una respuesta humorística: “¡No hay nada que temer, amigo humano!”
- También siguió la sátira con frases como “deberíamos usar ⸻ más seguido para hablar de ⸻”

Las cuentas nuevas de HN tienen 10 veces más probabilidades de usar EM dash

Observación de señales inusuales en los comentarios de HN

Método de recolección y análisis de datos

Resultados estadísticos principales

Interpretación y dudas

Material de referencia

Lecturas relacionadas

1 comentarios

Opiniones de Hacker News