- Solar Pro es el LLM más inteligente optimizado para ejecutarse en una sola GPU, y supera a modelos de grandes empresas tecnológicas como Microsoft, Meta y Google
- La versión preview se ofrece como modelo de código abierto y permite acceso gratuito a la API, para que desarrolladores y empresas puedan probar el modelo y enviar retroalimentación antes de su lanzamiento oficial en noviembre
- Soporta 22 mil millones de parámetros, más del doble que el modelo anterior, Solar Mini
- Gracias al método propietario de Upstage, Depth-Up Scaling (DUS), y a recetas avanzadas de datos, Solar Pro ofrece rendimiento de vanguardia mientras reduce significativamente el tamaño del modelo
- Alcanzó una puntuación de precisión de 52.11 en el benchmark MMLU Pro y 84.37 en el benchmark IFEval
- Estos resultados superan a modelos de tamaño similar como Phi 3 Medium de Microsoft, Llama 3.1 8B de Meta, Mistral NeMo 12B y Gemma 2 27B de Google
- El preview de Solar Pro estará disponible públicamente con acceso gratuito a la API como modelo de código abierto, incluyendo aplicaciones comerciales, hasta su lanzamiento oficial en noviembre
- La versión preview admite entradas en inglés y ofrece una ventana de contexto de 4,096 tokens
Aún no hay comentarios.