- En un estudio de análisis de sentimiento de publicaciones de Hacker News, cerca del 65% del total fue clasificado con sentimiento negativo, y estas publicaciones registraron en promedio puntajes más altos
- El puntaje promedio de las publicaciones negativas fue de 35.6 puntos, frente a un promedio general de 28 puntos, lo que confirma una prima de rendimiento del 27% aproximadamente
- El análisis se realizó sobre 32,000 publicaciones y 340,000 comentarios, y en 6 tipos de modelos apareció de forma consistente un sesgo negativo
- Entre los modelos utilizados están DistilBERT, BERT Multi, RoBERTa, Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B; el dashboard final usa resultados de DistilBERT por motivos de eficiencia
- Predomina una negatividad centrada en la crítica constructiva, como críticas técnicas, quejas sobre la industria y frustración con APIs, lo que sugiere una correlación entre participación y controversia
Resultados del análisis de sentimiento en Hacker News
- El puntaje promedio de las publicaciones en Hacker News es de 28 puntos, mientras que las publicaciones con sentimiento negativo registran un promedio de 35.6 puntos, mostrando una mayor participación
- El rendimiento de las publicaciones negativas es 27% más alto que el promedio general
- El estudio aborda la dinámica de atención en HN (Hacker News), e incluye curvas de decaimiento, apego preferencial, probabilidad de supervivencia y predicción de participación temprana
- El preprint relacionado está publicado en SSRN
Datos y configuración de modelos
- El análisis cubre 32,000 publicaciones y 340,000 comentarios
- Cerca del 65% del total fue clasificado con sentimiento negativo
- El investigador mencionó la posibilidad de que el clasificador estuviera sesgado hacia lo negativo, pero la misma tendencia se confirmó en los 6 modelos
- Los modelos usados fueron DistilBERT, BERT Multi, RoBERTa (basados en transformers) y Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B (basados en LLM)
- La distribución de sentimiento varía según el modelo, pero el sesgo hacia lo negativo se mantiene en todos
- El dashboard final usa los resultados de DistilBERT, que funcionan eficientemente en una canalización basada en Cloudflare
Definición y características del sentimiento negativo
- El contenido clasificado como “negativo” incluye críticas técnicas, escepticismo ante anuncios, quejas sobre prácticas de la industria y frustración relacionada con APIs
- La mayor parte de esta negatividad consiste en crítica sustantiva y no ataques personales
- La crítica técnica tiene una naturaleza distinta a la del ataque personal
- El investigador reconoce ambas posibilidades: si la negatividad provoca participación, o si el contenido polémico atrae al mismo tiempo expresiones negativas y atención
Próximos planes de publicación
- El investigador planea publicar pronto todo el código, el dataset y un dashboard para archivadores de HN
2 comentarios
La gente se interesa más por el chisme y el ruido. [incluida generalización apresurada]
Opiniones de Hacker News
Creo que el clasificador del OP está haciendo dos supuestos que afectan el resultado
Yo estoy escribiendo un comentario crítico ahora mismo, pero eso no lo hace necesariamente “negativo”. Más bien, puedo criticar precisamente porque los datos y las conclusiones del OP son claros. Creo que este tipo de crítica constructiva es justamente una señal de buena discusión
Es parcialmente cierto que la actitud escéptica se clasifica como negativa. Los datos de entrenamiento de SST-2 consideran negativa la evaluación crítica. Pero aquí “negativo” no significa hostil, sino evaluativo. La cultura crítica de HN se lee como negativa en este tipo de modelos, pero eso es un fenómeno natural dado el carácter del discurso técnico.
La neutralidad existe como una puntuación continua cerca de 0.5. Como los usuarios de HN tienden a tomar posturas firmes, aparece una distribución polarizada. Valdría la pena probar un modelo de tres clases más adelante.
Tu comentario es crítico, pero es discurso de alta calidad. Creo que la negatividad de HN no es hostilidad, sino crítica constructiva que impulsa la participación
Enlace al modelo DistilBERT SST-2
Los posts negativos que publiqué tuvieron mejor respuesta que los neutrales o positivos.
El título “Richard Stallman is Dead” tuvo la tasa de clics más alta, y otro modelo predice la probabilidad de que la proporción comentarios/votos sea mayor a 0.5. El clickbait, las discusiones de género y los temas de autos fueron especialmente fuertes.
Cuesta creer que la puntuación promedio sea 35. Antes el promedio era como de 8, así que me da curiosidad el criterio de muestreo
Puede que hayan faltado posts con 0 puntos, y por eso el promedio salió más alto. Gracias por el comentario; voy a revisarlo antes de publicar el paper. Tu clasificador también está interesante
Veo algo parecido en los comentarios. Los comentarios cortos y sarcásticos reciben mucha mejor respuesta que los análisis largos.
Es frustrante que los comentarios largos y trabajados sean ignorados, mientras uno corto escrito por impulso a veces “explota”
A HN no le gustan los chistes, salvo cuando vienen con explicación
Si tuvieras un blog, probablemente sentirías mejor este criterio de participación
Si “negativo” incluye crítica técnica, descontento con la industria o frustración con APIs, entonces la mayor parte de las discusiones de HN entra en esa categoría.
Dejar solo un “me gusta” en una publicación promocional de OpenAI no aporta nada; el análisis crítico es precisamente la participación valiosa.
Creo que un post popular sin comentarios es más bien señal de que el sitio está funcionando bien
Nosotros mismos filtramos para favorecer las reacciones negativas. El contenido positivo es autocontenido y no induce respuesta, pero el contenido negativo provoca interacción
Por eso nos atraen más las noticias negativas, mientras las positivas solo las pasamos de largo. Ese es el núcleo de la economía de la atención
La crítica técnica no es lo mismo que el ataque personal. La negatividad de HN es en su mayoría crítica constructiva.
Cuando el cinismo se pasa de la raya, siempre aparece el clásico “quejarse de las quejas”.
Yo prefiero que me digan “tienes algo entre los dientes” a que me elogien
Como la moderación de HN elimina rápido el contenido hostil, lo que queda suele ser crítica productiva.
Lo interesante es que esta “negatividad” está asociada con un 27% más de participación. Es decir, la comunidad técnica valora más la crítica que la promoción.
Voy a aclarar en el paper que “sentimiento negativo” significa crítica evaluativa según el modelo SST-2, no discurso tóxico
Cuando antes se podía acceder a la API de Reddit, hice un experimento con la app lectora rif para bloquear subreddits de tono negativo.
Después de bloquear cientos, lo único que quedó fue contenido positivo de animales y hobbies. Ahí me di cuenta de cuánto gira Reddit alrededor de la negatividad, aunque también, cuando la quitas, se vuelve bastante aburrido
Enlace a la lista de bloqueo
Esos posts se sienten como si bots hablaran con bots. Sospecho que Reddit permite esa estructura para aumentar la exposición a anuncios
En internet no hay combinación más poderosa que quejarse o corregir a alguien.
Como usuario de ESL (English as a Second Language), uno de los primeros términos de internet que aprendí fue “flamewar”
Según el paper, la desigualdad de atención en HN es muy fuerte. Tiene un coeficiente de Gini de 0.89, más alto que Twitter
Esto probablemente se debe a la estructura de exposición de HN. Los posts nuevos empiezan en /newest y, si no reciben la atención inicial de unos pocos, prácticamente desaparecen.
A diferencia de Reddit, donde hay una exposición base, en HN hay que pasar esa puerta inicial para llegar a la principal
Los ingenieros se dedican a resolver problemas, así que naturalmente tienden al pensamiento crítico.
En las ferias industriales, los ingenieros se acercaban con los brazos cruzados y una actitud fría, mientras que la comunidad maker estaba llena de energía positiva.
Al final, es la diferencia entre “el vaso está medio vacío” y “el vaso está medio lleno”