Trump Saith: feed de análisis en tiempo real de las declaraciones de Trump y su impacto en la economía de Corea
(trump-saith.com)¡Hola! Hice un servicio llamado 'Trump-Saith' que analiza en tiempo real las declaraciones del expresidente Trump y ofrece su impacto en la economía y los mercados de Corea.
Sitio web: https://trump-saith.com/ (https://trump-saith.com/)
Funciones principales: recolección en tiempo real de declaraciones de Trump -> resumen en coreano con LLM -> análisis del impacto económico -> entrega en feed tras eliminar duplicados
💡 ¿Por qué lo hice?
Últimamente, una sola declaración de Trump ha hecho que la bolsa y el tipo de cambio en Corea se muevan con frecuencia. Pero es difícil seguir los textos originales que salen en sitios como Truth Social, y las noticias existentes tardan porque pasan por procesos de edición.
Por eso empecé este proyecto con la idea de “recolectar directamente las declaraciones lo más rápido posible y mostrar solo lo esencial resumido desde la perspectiva de desarrolladores e inversionistas”.
🛠️ Stack técnico y arquitectura
Como esto es una comunidad de desarrolladores, quería compartir cómo está implementado. Construí el pipeline con 4 capas independientes.
-
Data Collection (Python, APScheduler)
Monitorea la API de Truth Social y canales RSS cada 1 minuto para recolectar datos raw.
Los datos recolectados se almacenan de forma permanente en Oracle DB y se envían de forma asíncrona a la siguiente capa mediante Redis Streams. -
Analysis (Gemini 2.0 Flash)
Analiza los textos recolectados con el modelo Gemini 2.0 Flash.
No es una simple traducción: extrae resúmenes y palabras clave desde la perspectiva de su “impacto en la economía/mercado coreano”. (resumen de 3 a 5 oraciones) -
Deduplication (Sentence-Transformers, Qdrant)
Procesa declaraciones con el mismo contenido recolectadas desde varios canales.
Genera embeddings de oraciones con el modelo all-MiniLM-L6-v2 y filtra duplicados en Qdrant (Vector DB) usando similitud coseno con umbral de 0.85. -
API & Feed
Finalmente, entrega al cliente los datos depurados.
✨ Diferenciadores
Velocidad: empieza el análisis en cuanto se publica el texto original de una declaración de Trump, antes de que salga una nota periodística.
Análisis de contexto: mediante prompts para LLM, obtiene “¿qué significa esta declaración para industrias de Corea como semiconductores o automotriz?”.
Feed limpio: minimiza el ruido de ver la misma noticia repetida mediante eliminación de duplicados basada en similitud.
🚀 Planes a futuro
Por ahora estoy ampliando los canales de recolección, y más adelante planeo agregar notificaciones push en tiempo real para palabras clave específicas (por ejemplo, Samsung Electronics, aranceles, etc.).
Espero que pueda ser una pequeña ayuda para quienes se interesan en la intersección entre IT y economía. ¡Toda retroalimentación es bienvenida!
Gracias.
8 comentarios
Explotó 403
¡Gracias! ¡Ya registré el proyecto!
"ex" presidente
No lo revisé con suficiente detalle... ¡!
Parece que es un texto escrito con un modelo cuyos datos de entrenamiento van de 2021.01 a 2025.01, jajaja
Qué elegante
Pero entonces, ¿ese análisis del impacto económico es lo que aparece con una o dos frases por tarjeta, como un resumen?
Si no, en mi pantalla ahora mismo no me aparece ninguna información llamada análisis de impacto.
No se muestra por separado.
Creo que tendríamos que conversar si podemos reforzar el contenido del análisis de impacto en el resumen.
¡Gracias!