2 puntos por GN⁺ 2026-01-07 | 2 comentarios | Compartir por WhatsApp
  • En un estudio de análisis de sentimiento de publicaciones de Hacker News, cerca del 65% del total fue clasificado con sentimiento negativo, y estas publicaciones registraron en promedio puntajes más altos
  • El puntaje promedio de las publicaciones negativas fue de 35.6 puntos, frente a un promedio general de 28 puntos, lo que confirma una prima de rendimiento del 27% aproximadamente
  • El análisis se realizó sobre 32,000 publicaciones y 340,000 comentarios, y en 6 tipos de modelos apareció de forma consistente un sesgo negativo
  • Entre los modelos utilizados están DistilBERT, BERT Multi, RoBERTa, Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B; el dashboard final usa resultados de DistilBERT por motivos de eficiencia
  • Predomina una negatividad centrada en la crítica constructiva, como críticas técnicas, quejas sobre la industria y frustración con APIs, lo que sugiere una correlación entre participación y controversia

Resultados del análisis de sentimiento en Hacker News

  • El puntaje promedio de las publicaciones en Hacker News es de 28 puntos, mientras que las publicaciones con sentimiento negativo registran un promedio de 35.6 puntos, mostrando una mayor participación
    • El rendimiento de las publicaciones negativas es 27% más alto que el promedio general
  • El estudio aborda la dinámica de atención en HN (Hacker News), e incluye curvas de decaimiento, apego preferencial, probabilidad de supervivencia y predicción de participación temprana
    • El preprint relacionado está publicado en SSRN

Datos y configuración de modelos

  • El análisis cubre 32,000 publicaciones y 340,000 comentarios
  • Cerca del 65% del total fue clasificado con sentimiento negativo
    • El investigador mencionó la posibilidad de que el clasificador estuviera sesgado hacia lo negativo, pero la misma tendencia se confirmó en los 6 modelos
  • Los modelos usados fueron DistilBERT, BERT Multi, RoBERTa (basados en transformers) y Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B (basados en LLM)
    • La distribución de sentimiento varía según el modelo, pero el sesgo hacia lo negativo se mantiene en todos
    • El dashboard final usa los resultados de DistilBERT, que funcionan eficientemente en una canalización basada en Cloudflare

Definición y características del sentimiento negativo

  • El contenido clasificado como “negativo” incluye críticas técnicas, escepticismo ante anuncios, quejas sobre prácticas de la industria y frustración relacionada con APIs
  • La mayor parte de esta negatividad consiste en crítica sustantiva y no ataques personales
    • La crítica técnica tiene una naturaleza distinta a la del ataque personal
  • El investigador reconoce ambas posibilidades: si la negatividad provoca participación, o si el contenido polémico atrae al mismo tiempo expresiones negativas y atención

Próximos planes de publicación

  • El investigador planea publicar pronto todo el código, el dataset y un dashboard para archivadores de HN

2 comentarios

 
shakespeares 2026-01-07

La gente se interesa más por el chisme y el ruido. [incluida generalización apresurada]

 
GN⁺ 2026-01-07
Opiniones de Hacker News
  • Creo que el clasificador del OP está haciendo dos supuestos que afectan el resultado

    1. agrupa la actitud escéptica como negativa
    2. no permite una categoría neutral
      Yo estoy escribiendo un comentario crítico ahora mismo, pero eso no lo hace necesariamente “negativo”. Más bien, puedo criticar precisamente porque los datos y las conclusiones del OP son claros. Creo que este tipo de crítica constructiva es justamente una señal de buena discusión
    • Soy el OP :)
      Es parcialmente cierto que la actitud escéptica se clasifica como negativa. Los datos de entrenamiento de SST-2 consideran negativa la evaluación crítica. Pero aquí “negativo” no significa hostil, sino evaluativo. La cultura crítica de HN se lee como negativa en este tipo de modelos, pero eso es un fenómeno natural dado el carácter del discurso técnico.
      La neutralidad existe como una puntuación continua cerca de 0.5. Como los usuarios de HN tienden a tomar posturas firmes, aparece una distribución polarizada. Valdría la pena probar un modelo de tres clases más adelante.
      Tu comentario es crítico, pero es discurso de alta calidad. Creo que la negatividad de HN no es hostilidad, sino crítica constructiva que impulsa la participación
    • Yo también iba a señalar que la actitud escéptica queda agrupada como negativa. La mirada crítica de HN es más bien una característica positiva, pero este tipo de distinciones emocionales sutiles todavía es difícil técnicamente
    • Hay mucha crítica legítima, pero también existe el estilo de buscarle la quinta pata al gato tipo “reply guy” o las quejas repetitivas sobre ciertas empresas. Eso es difícil de clasificar y, comparado con Reddit, siento que HN está mucho mejor
    • No sé si este es exactamente el modelo que usó el OP, pero clasifica tu comentario como 99.9% positivo
      Enlace al modelo DistilBERT SST-2
    • Exacto, el punto central del problema es que el pensamiento crítico se clasifica como negativo
  • Los posts negativos que publiqué tuvieron mejor respuesta que los neutrales o positivos.
    El título “Richard Stallman is Dead” tuvo la tasa de clics más alta, y otro modelo predice la probabilidad de que la proporción comentarios/votos sea mayor a 0.5. El clickbait, las discusiones de género y los temas de autos fueron especialmente fuertes.
    Cuesta creer que la puntuación promedio sea 35. Antes el promedio era como de 8, así que me da curiosidad el criterio de muestreo

    • La muestra se recolectó de todos los posts y comentarios de los últimos 35 días usando la API de hn-archiver.
      Puede que hayan faltado posts con 0 puntos, y por eso el promedio salió más alto. Gracias por el comentario; voy a revisarlo antes de publicar el paper. Tu clasificador también está interesante
    • El ejemplo de “Richard Stallman is Dead” da demasiada risa. Me recuerda al viejo titular de periódico “Generalissimo Francisco Franco Is Still Dead”. Claro, RMS sigue vivo
    • Pregunta personal: subes papers científicos con muchísima frecuencia. He visto días con más de 30, y no parece posible leerlos todos, así que me da curiosidad tu motivación y tu proceso de selección de material
  • Veo algo parecido en los comentarios. Los comentarios cortos y sarcásticos reciben mucha mejor respuesta que los análisis largos.
    Es frustrante que los comentarios largos y trabajados sean ignorados, mientras uno corto escrito por impulso a veces “explota”

    • Mi karma es 104,872. Las páginas de HN Leaders y Best Comments son interesantes.
      A HN no le gustan los chistes, salvo cuando vienen con explicación
    • Lo largo no siempre es mejor. Existe una estética de la brevedad. Lograr impacto con 20 caracteres en vez de 2,000 es más difícil y más valioso
    • Yo también uso dos cuentas, y la cuenta para comentarios emocionales o impulsivos tiene una eficiencia de karma 4 veces mayor que la principal. Eso sí, el promedio es más bajo y la varianza es mayor
    • Eso de que “el buen contenido no recibe recompensa” quizá signifique que no estamos creando contenido tan bueno como creemos.
      Si tuvieras un blog, probablemente sentirías mejor este criterio de participación
    • Yo también quiero cambiar mis hábitos de upvote después de ver esto. Me pregunto si en HN el upvote silencioso se entiende como una forma de acuerdo
  • Si “negativo” incluye crítica técnica, descontento con la industria o frustración con APIs, entonces la mayor parte de las discusiones de HN entra en esa categoría.
    Dejar solo un “me gusta” en una publicación promocional de OpenAI no aporta nada; el análisis crítico es precisamente la participación valiosa.
    Creo que un post popular sin comentarios es más bien señal de que el sitio está funcionando bien

    • Me gusta que presenten los datos y dejen la interpretación al lector
    • Estoy de acuerdo en que hay que separar la criticidad de la toxicidad. Mezclar ambos conceptos es un error
  • Nosotros mismos filtramos para favorecer las reacciones negativas. El contenido positivo es autocontenido y no induce respuesta, pero el contenido negativo provoca interacción

    • Por la estructura del sitio, un comentario simplemente positivo queda sustituido por el botón de upvote
    • Los comentarios que solo dicen “me gusta” se consideran inútiles, así que al final hay más comentarios neutrales o críticos
    • Los humanos somos evolutivamente sensibles a los estímulos negativos. Los individuos que ignoraban el peligro no sobrevivían.
      Por eso nos atraen más las noticias negativas, mientras las positivas solo las pasamos de largo. Ese es el núcleo de la economía de la atención
    • Yo aprendo más de los comentarios que agregan información que de la crítica destructiva. Esos aportes suelen ser más novedosos y especializados
    • (En tono de broma) “¡Sí! ... ah, espera”
  • La crítica técnica no es lo mismo que el ataque personal. La negatividad de HN es en su mayoría crítica constructiva.
    Cuando el cinismo se pasa de la raya, siempre aparece el clásico “quejarse de las quejas”.
    Yo prefiero que me digan “tienes algo entre los dientes” a que me elogien

    • El paper debería tratar esta distinción con más claridad. El modelo no puede distinguir entre “este diseño de API está mal” y “esta empresa es pésima”.
      Como la moderación de HN elimina rápido el contenido hostil, lo que queda suele ser crítica productiva.
      Lo interesante es que esta “negatividad” está asociada con un 27% más de participación. Es decir, la comunidad técnica valora más la crítica que la promoción.
      Voy a aclarar en el paper que “sentimiento negativo” significa crítica evaluativa según el modelo SST-2, no discurso tóxico
    • El cinismo no es una filosofía de decir la verdad. Decir hechos no es lo mismo que criticar
  • Cuando antes se podía acceder a la API de Reddit, hice un experimento con la app lectora rif para bloquear subreddits de tono negativo.
    Después de bloquear cientos, lo único que quedó fue contenido positivo de animales y hobbies. Ahí me di cuenta de cuánto gira Reddit alrededor de la negatividad, aunque también, cuando la quitas, se vuelve bastante aburrido
    Enlace a la lista de bloqueo

    • El ambiente cínico de Reddit es como una epidemia. Se junta gente infeliz y refuerzan mutuamente su desesperación. En su mayoría son jóvenes con poca experiencia
    • Que el contenido polémico genere más discusión es parte de la naturaleza humana. Escuchas largo rato los problemas amorosos de un amigo, pero si le va bien no hay mucho que decir
    • Yo también evito la política y el contenido provocador, y solo veo posts de hobbies o creación. Reddit de verdad es un espacio muy mezclado
    • Creo que una proporción 45:65 entre positivo y negativo es el equilibrio más interesante. Con 50:50 el contenido se vuelve común. En ese sentido HN es mejor que las redes sociales
    • Todavía uso rif. Lo uso cambiando la API key con Revanced. Han aumentado los posts tipo carnada para IA en Reddit, así que bloqueo esos subreddits.
      Esos posts se sienten como si bots hablaran con bots. Sospecho que Reddit permite esa estructura para aumentar la exposición a anuncios
  • En internet no hay combinación más poderosa que quejarse o corregir a alguien.
    Como usuario de ESL (English as a Second Language), uno de los primeros términos de internet que aprendí fue “flamewar”

    • También hubo quien preguntó qué significa ESL
  • Según el paper, la desigualdad de atención en HN es muy fuerte. Tiene un coeficiente de Gini de 0.89, más alto que Twitter
    Esto probablemente se debe a la estructura de exposición de HN. Los posts nuevos empiezan en /newest y, si no reciben la atención inicial de unos pocos, prácticamente desaparecen.
    A diferencia de Reddit, donde hay una exposición base, en HN hay que pasar esa puerta inicial para llegar a la principal

    • Gracias a esa estructura, la reacción temprana funciona como indicador predictivo de éxito
  • Los ingenieros se dedican a resolver problemas, así que naturalmente tienden al pensamiento crítico.
    En las ferias industriales, los ingenieros se acercaban con los brazos cruzados y una actitud fría, mientras que la comunidad maker estaba llena de energía positiva.
    Al final, es la diferencia entre “el vaso está medio vacío” y “el vaso está medio lleno”