7 puntos por kangbit 2026-03-25 | 8 comentarios | Compartir por WhatsApp

¡Hola! Hice un servicio llamado 'Trump-Saith' que analiza en tiempo real las declaraciones del expresidente Trump y ofrece su impacto en la economía y los mercados de Corea.

Sitio web: https://trump-saith.com/ (https://trump-saith.com/)
Funciones principales: recolección en tiempo real de declaraciones de Trump -> resumen en coreano con LLM -> análisis del impacto económico -> entrega en feed tras eliminar duplicados


💡 ¿Por qué lo hice?

Últimamente, una sola declaración de Trump ha hecho que la bolsa y el tipo de cambio en Corea se muevan con frecuencia. Pero es difícil seguir los textos originales que salen en sitios como Truth Social, y las noticias existentes tardan porque pasan por procesos de edición.
Por eso empecé este proyecto con la idea de “recolectar directamente las declaraciones lo más rápido posible y mostrar solo lo esencial resumido desde la perspectiva de desarrolladores e inversionistas”.

🛠️ Stack técnico y arquitectura

Como esto es una comunidad de desarrolladores, quería compartir cómo está implementado. Construí el pipeline con 4 capas independientes.

  • Data Collection (Python, APScheduler)
    Monitorea la API de Truth Social y canales RSS cada 1 minuto para recolectar datos raw.
    Los datos recolectados se almacenan de forma permanente en Oracle DB y se envían de forma asíncrona a la siguiente capa mediante Redis Streams.

  • Analysis (Gemini 2.0 Flash)
    Analiza los textos recolectados con el modelo Gemini 2.0 Flash.
    No es una simple traducción: extrae resúmenes y palabras clave desde la perspectiva de su “impacto en la economía/mercado coreano”. (resumen de 3 a 5 oraciones)

  • Deduplication (Sentence-Transformers, Qdrant)
    Procesa declaraciones con el mismo contenido recolectadas desde varios canales.
    Genera embeddings de oraciones con el modelo all-MiniLM-L6-v2 y filtra duplicados en Qdrant (Vector DB) usando similitud coseno con umbral de 0.85.

  • API & Feed
    Finalmente, entrega al cliente los datos depurados.

✨ Diferenciadores

Velocidad: empieza el análisis en cuanto se publica el texto original de una declaración de Trump, antes de que salga una nota periodística.
Análisis de contexto: mediante prompts para LLM, obtiene “¿qué significa esta declaración para industrias de Corea como semiconductores o automotriz?”.
Feed limpio: minimiza el ruido de ver la misma noticia repetida mediante eliminación de duplicados basada en similitud.

🚀 Planes a futuro

Por ahora estoy ampliando los canales de recolección, y más adelante planeo agregar notificaciones push en tiempo real para palabras clave específicas (por ejemplo, Samsung Electronics, aranceles, etc.).
Espero que pueda ser una pequeña ayuda para quienes se interesan en la intersección entre IT y economía. ¡Toda retroalimentación es bienvenida!
Gracias.

8 comentarios

 
roxie 2026-04-01

Explotó 403

 
[Este comentario fue ocultado.]
 
kangbit 2026-03-27

¡Gracias! ¡Ya registré el proyecto!

 
brainer 2026-03-26

"ex" presidente

 
kangbit 2026-03-26

No lo revisé con suficiente detalle... ¡!

 
mhpark 2026-03-26

Parece que es un texto escrito con un modelo cuyos datos de entrenamiento van de 2021.01 a 2025.01, jajaja

 
dankim0124 2026-03-25

Qué elegante

Pero entonces, ¿ese análisis del impacto económico es lo que aparece con una o dos frases por tarjeta, como un resumen?
Si no, en mi pantalla ahora mismo no me aparece ninguna información llamada análisis de impacto.

 
kangbit 2026-03-26

No se muestra por separado.
Creo que tendríamos que conversar si podemos reforzar el contenido del análisis de impacto en el resumen.
¡Gracias!