Upstage lanza Solar Pro 2, un modelo de razonamiento de nivel frontier

(upstage.ai)

7 puntos por GN⁺ 2025-07-14 | 2 comentarios | Compartir por WhatsApp

Solar Pro 2 es el nuevo modelo de lenguaje frontier de Upstage que, pese a su tamaño compacto de 31B parámetros, ofrece razonamiento de próxima generación, versatilidad para usar diversas herramientas y rendimiento de primer nivel en coreano y procesamiento multilingüe
En benchmarks clave en coreano (por ejemplo, Ko-Arena-Hard-Auto, Ko-MMLU, etc.) muestra resultados comparables o superiores a GPT-4 y Claude 3, y genera respuestas consistentes y precisas también en dominios especializados como legal, finanzas y salud
En su modo de razonamiento avanzado puede abordar tareas como problemas matemáticos, preguntas y respuestas lógicas y razonamiento complejo de múltiples pasos, y también demuestra un rendimiento sobresaliente en evaluaciones de código e ingeniería
Cuenta con una arquitectura tipo agente para aplicaciones reales de trabajo, además de funciones de integración con herramientas, generación de archivos y ejecución autónoma, por lo que puede adoptarse de inmediato en entornos empresariales
Un LLM de nueva generación enfocado en la utilidad real de negocio, con despliegue en la nube y on-premise, mejoras en estabilidad y usabilidad, y soporte para adopción empresarial

Rendimiento global de nivel frontier comprobado: lanzamiento oficial de Solar Pro 2

Solar Pro 2 es un modelo de lenguaje frontier de nueva generación desarrollado por Upstage que, pese a su tamaño compacto de 31B parámetros, ofrece amplio procesamiento multilingüe, capacidad de razonamiento avanzada y uso de herramientas optimizado para trabajo real
En particular, ha demostrado un rendimiento lo bastante sólido en coreano como para competir con GPT-4 y Claude 3, mostrando precisión y consistencia también en dominios de alta exigencia como legal, finanzas y salud

En benchmarks como Ko-Arena-Hard-Auto logró resultados equivalentes a los de los modelos más avanzados
En diversas tareas de NLP en coreano como Ko-MMLU, Hae-Rae y Ko-IFEval muestra un rendimiento líder en comprensión y generación del lenguaje en general
También ofrece resultados estables y precisos en dominios especializados (legal, finanzas, salud, etc.)

En un momento en que la transparencia y la explicabilidad del proceso de razonamiento son importantes, Solar Pro 2 va más allá de la predicción simple y logra análisis, síntesis y pensamiento de múltiples etapas
En benchmarks generales de razonamiento como MMLU, MMLU-Pro y HumanEval, el rendimiento en tareas coreanas de múltiples pasos mejoró significativamente
También destaca en problemas matemáticos de alta dificultad como Math500 y AIME, así como en el manejo de tareas complejas de desarrollo como SWE-Bench Agentless
Ofrece una eficiencia de razonamiento sobresaliente en relación con su número de parámetros

Solar Pro 2 es un LLM tipo agente con funciones aplicables de inmediato al trabajo real, como integración con herramientas, generación de archivos y ejecución autónoma de tareas
Se enfatiza que no es solo un modelo grande, sino una IA realista que puede incorporarse de manera efectiva al trabajo
Ejemplo: puede aplicarse a diversos escenarios de automatización, como la generación automática de reportes sobre movimientos de competidores

idunno 2025-07-15

Habría estado bien que mostraran con cifras cuánto mejoró, qué tan sobresaliente es y qué tan preciso es.

sanxiyn 2025-07-15

¿Compararlo con Claude 3 justo cuando salió Claude 4 no es casi un engaño...?