7 puntos por kimchi 27 일 전 | 4 comentarios | Compartir por WhatsApp

Se conectó un LLM a Nemotron-Personas-Korea para ejecutar una simulación de las elecciones locales de 2026
para gobernadores y alcaldes metropolitanos.

Se hizo scraping de 8,300 candidatos desde la NEC → se muestrearon 5,100 personas, 300 por cada provincia o ciudad, a partir de las personas sintéticas → se simularon 4,800 votos con Gemma 4 e4b (RTX 5060, 3 horas).

Resultados

Alcalde metropolitano de Daegu: Kim Han-gu (independiente) 90.5% / Lee Jae-man (PPP) 8.2% / Kim Boo-kyum (Partido Democrático) 1.4%

Un ex primer ministro, cuatro veces legislador y originario de Daegu obtuvo 1.4%. El LLM se dejó arrastrar por la etiqueta "trabajador" en la persona sintética y concentró los votos en un candidato independiente obrero.

Patrón general:

  • Prima del cargo en funciones exagerada (Kim Jin-tae en Gangwon 100%, Lee Cheol-woo en Gyeongbuk 99%)
  • Emparejamiento simple por etiqueta de ocupación
  • Explosión de abstenciones cuando falta información (Chungbuk 73%, Incheon 93%)

Conclusión

La simulación de personas sintéticas con LLM no puede sustituir a las encuestas de opinión. Confirma de forma cuantitativa
que los estudios estadounidenses sobre LLM-as-voter no se trasladan tal cual a la política coreana.

4 comentarios

 
calmlake79 26 일 전

Soy el creador de "ManyPerson" que aparece en "Artículos recomendados".
Como mencionaste, la simulación de personas con LLM no es un sustituto de las encuestas de opinión pública, sino un "complemento".
Por supuesto, mientras más se mejore la precisión de las personas y se incluya más información de contexto, más podrá acercarse el resultado a los valores reales, pero aun así yo también desarrollé este servicio pensando, en esencia, en un servicio complementario más que en uno sustitutivo.
Aun así, creo que tiene suficiente valor.

 
kimchi 26 일 전

¡Estoy de acuerdo!!

 
calmlake79 26 일 전

Ahora que lo veo, hace rato andaba un poco disperso, así que dejé la respuesta a medias ;;

Antes que nada, creo que uno de los principales valores de las respuestas de personas generadas por IA es que pueden ofrecerle al usuario o al autor una perspectiva más amplia.

Yo también lo sentí mientras desarrollaba este servicio: definitivamente se me amplió la forma de ver el mundo y los acontecimientos.
Pasé de "¿por qué piensa eso de esa manera?" a "ah, también se puede recibir e interpretar un hecho así de esa forma..."
y sentí que eso me permitía mirar las cosas de manera más amplia.
Creo que en el caso de lo que mencionaste sobre las elecciones pasaría algo parecido.

Justo ahora hice una prueba tomando como objetivo Daegu, y sí salió algo bastante alejado de la realidad.

manyperson Link

En nuestro servicio también hicimos pruebas parecidas, y aunque los resultados no salen exactamente... como yo pensaba, sí se pueden ver perspectivas diversas. (Claro, por la actualización de información reciente no es tan preciso, pero creo que eso se podrá ir cubriendo técnicamente poco a poco).

De hecho, con nuestro servicio también hicimos pruebas pensando "a ver qué pensará la gente...", y salía muy positivo, pero en la realidad todavía no lo sé bien ^^;;

 
kimchi 26 일 전

Como los LLM razonan a nivel de tokens de texto, parece que cuando aparece una etiqueta de alta frecuencia se activan los patrones con los que esa etiqueta apareció durante el entrenamiento, y tienden a imponerse sobre otra información.

Además, aunque una persona tenga etiquetas detalladas en su persona, su comportamiento de voto no queda determinado por una función que el LLM pueda inferir; lo que realmente define el comportamiento político son demasiados factores que no están en una persona compuesta, como el historial de voto previo, el partido que apoyan familiares y colegas, las noticias que vio recientemente y la simpatía personal hacia cada candidato.
Esto parece operar al mismo tiempo no solo aquí, sino también al inferir toda clase de situaciones o fenómenos económicos y políticos (específicos).