5 puntos por xguru 2024-09-12 | Aún no hay comentarios. | Compartir por WhatsApp
  • Solar Pro es el LLM más inteligente optimizado para ejecutarse en una sola GPU, y supera a modelos de grandes empresas tecnológicas como Microsoft, Meta y Google
  • La versión preview se ofrece como modelo de código abierto y permite acceso gratuito a la API, para que desarrolladores y empresas puedan probar el modelo y enviar retroalimentación antes de su lanzamiento oficial en noviembre
  • Soporta 22 mil millones de parámetros, más del doble que el modelo anterior, Solar Mini
  • Gracias al método propietario de Upstage, Depth-Up Scaling (DUS), y a recetas avanzadas de datos, Solar Pro ofrece rendimiento de vanguardia mientras reduce significativamente el tamaño del modelo
  • Alcanzó una puntuación de precisión de 52.11 en el benchmark MMLU Pro y 84.37 en el benchmark IFEval
  • Estos resultados superan a modelos de tamaño similar como Phi 3 Medium de Microsoft, Llama 3.1 8B de Meta, Mistral NeMo 12B y Gemma 2 27B de Google
  • El preview de Solar Pro estará disponible públicamente con acceso gratuito a la API como modelo de código abierto, incluyendo aplicaciones comerciales, hasta su lanzamiento oficial en noviembre
  • La versión preview admite entradas en inglés y ofrece una ventana de contexto de 4,096 tokens

Aún no hay comentarios.

Aún no hay comentarios.