LLM agente de 7B parámetros especializado para análisis de noticias e investigación de inversión del mercado bursátil coreano
(huggingface.co)Presentamos VELA, un modelo de lenguaje especializado en el mercado bursátil coreano (KOSPI+KOSDAQ).
Fue ajustado a partir de Qwen2.5-7B-Instruct con un pipeline de SFT + DPO.
Por qué lo hicimos
Los LLM financieros existentes tenían muchas alucinaciones con la terminología del mercado coreano,
y también presentaban un problema de language leak en el que cambiaban a chino/inglés a mitad de la respuesta.
VELA corrige de forma enfocada estos dos problemas mediante DPO.
Datos de entrenamiento
- SFT: 36,713 muestras / 2,135 acciones (clasificación de noticias, señales de subidas y caídas bruscas, reportes de corredoras, tool calling, análisis sectorial/macro, etc.)
- DPO: 24,779 pares (eliminación de filtraciones a chino e inglés, alineación del formato de Reasoning Trace)
Formato de salida
- Reasoning Trace – proceso de razonamiento paso a paso en formato JSON (
search → analyze → confidence) - Synthesis Report – reporte de investigación de 7 secciones (resumen, indicadores, flujo de capital, impacto de noticias, riesgos, opinión de inversión)
Rendimiento (basado en RTX 3060 12GB)
| Formato | Velocidad | Tamaño | Chinese Leak |
|---|---|---|---|
| Q4_K_M | 36 tok/s | 4.4GB | 0/5 CLEAN |
| Q8_0 | 25 tok/s | 7.6GB | 0/5 CLEAN |
Atención: para un uso real, deben proporcionarse al modelo fuentes de noticias y datos adecuados. Si no hay fuentes precisas, pueden producirse alucinaciones. Está diseñado para usarse junto con https://github.com/unohee/vela-framework.
Interfaces compatibles
llama-cpp-python / Ollama / vLLM / Transformers / MLX
Licencia: Apache 2.0
🤗 https://huggingface.co/intrect/VELA
Las cotizaciones en tiempo real se suministran mediante una API externa, y VELA fue diseñado como la capa de inferencia sobre esa base.
Su propósito es informativo y no constituye asesoría de inversión.
3 comentarios
Impresionante ^^
¡Qué bueno! ¿También es estable con 7B?
Para el tamaño del modelo, las tareas básicas son claramente mejores que en el modelo base. ¡Supongo que también tendría que subir los benchmarks!