8 puntos por unohee 2026-03-31 | 3 comentarios | Compartir por WhatsApp

Presentamos VELA, un modelo de lenguaje especializado en el mercado bursátil coreano (KOSPI+KOSDAQ).

Fue ajustado a partir de Qwen2.5-7B-Instruct con un pipeline de SFT + DPO.

Por qué lo hicimos
Los LLM financieros existentes tenían muchas alucinaciones con la terminología del mercado coreano,
y también presentaban un problema de language leak en el que cambiaban a chino/inglés a mitad de la respuesta.
VELA corrige de forma enfocada estos dos problemas mediante DPO.

Datos de entrenamiento

  • SFT: 36,713 muestras / 2,135 acciones (clasificación de noticias, señales de subidas y caídas bruscas, reportes de corredoras, tool calling, análisis sectorial/macro, etc.)
  • DPO: 24,779 pares (eliminación de filtraciones a chino e inglés, alineación del formato de Reasoning Trace)

Formato de salida

  1. Reasoning Trace – proceso de razonamiento paso a paso en formato JSON (search → analyze → confidence)
  2. Synthesis Report – reporte de investigación de 7 secciones (resumen, indicadores, flujo de capital, impacto de noticias, riesgos, opinión de inversión)

Rendimiento (basado en RTX 3060 12GB)

Formato Velocidad Tamaño Chinese Leak
Q4_K_M 36 tok/s 4.4GB 0/5 CLEAN
Q8_0 25 tok/s 7.6GB 0/5 CLEAN

Atención: para un uso real, deben proporcionarse al modelo fuentes de noticias y datos adecuados. Si no hay fuentes precisas, pueden producirse alucinaciones. Está diseñado para usarse junto con https://github.com/unohee/vela-framework.

Interfaces compatibles
llama-cpp-python / Ollama / vLLM / Transformers / MLX

Licencia: Apache 2.0

🤗 https://huggingface.co/intrect/VELA

Las cotizaciones en tiempo real se suministran mediante una API externa, y VELA fue diseñado como la capa de inferencia sobre esa base.
Su propósito es informativo y no constituye asesoría de inversión.

3 comentarios

 
310writer 2026-04-06

Impresionante ^^

 
ahiou 2026-04-01

¡Qué bueno! ¿También es estable con 7B?

 
unohee 2026-04-01

Para el tamaño del modelo, las tareas básicas son claramente mejores que en el modelo base. ¡Supongo que también tendría que subir los benchmarks!