Explorador de personas coreanas basado en Nemotron-Personas-Korea
(microworld.dev)Este es un explorador de personas coreanas que utiliza el dataset Nemotron-Personas-Korea publicado por NVIDIA.
Este dataset es un conjunto sintético a escala de 1 millón de personas coreanas, e incluye edad, ocupación, región, relaciones familiares y más. La forma en que se creó el dataset y su información estadística se explican en detalle en https://es.news.hada.io/topic?id=28919.
Las funciones principales del explorador de personas son las siguientes.
-
Puedes buscar personas o encontrar personas similares. Usa el modelo de embeddings de Qwen para comparar similitud.
-
Puedes revisar la distribución poblacional de las personas en el mapa. Utiliza la información de ubicación incluida en el dataset.
-
Puedes conversar con las personas. Puede responder preguntas muy simples.
Se extrajeron embeddings de 1024 dimensiones para todo el dataset con el modelo de embeddings Qwen 0.6 y se creó como un dataset de Hugging Face. Como la columna *_persona tiene la característica de incluir nombres repetidamente, los valores de embedding pueden estar sesgados hacia los nombres.
- Hugging Face Nemotron-Personas-Korea-Qwen3-0.6B-embeddings
Aún no hay comentarios.