12 puntos por xguru 2024-07-19 | 1 comentarios | Compartir por WhatsApp
  • Se espera que GPT-4o mini haga que la inteligencia artificial sea mucho más económica y amplíe significativamente el rango de aplicaciones construidas con IA
  • Obtuvo una puntuación de 82% en MMLU y actualmente supera a GPT-4 en preferencia de chat en el leaderboard de LMSYS
  • Su precio es de 15 centavos por 1 millón de tokens de entrada y 60 centavos por 1 millón de tokens de salida, 10 veces más barato que el modelo de punta anterior y más de 60% más barato que GPT-3.5 Turbo

Funciones principales de GPT-4o mini

  • Puede realizar una amplia variedad de tareas con bajo costo y baja latencia
  • Es ideal para aplicaciones que encadenan o paralelizan múltiples llamadas al modelo (por ejemplo, varias llamadas a API)
  • Es ideal para aplicaciones que pasan grandes cantidades de contexto al modelo (por ejemplo, una base de código completa o el historial de una conversación)
  • Es ideal para aplicaciones que intercambian respuestas de texto rápidas y en tiempo real con clientes (por ejemplo, chatbots de soporte al cliente)
  • Soporta texto y visión en la API, y en el futuro soportará entradas y salidas de texto, imagen, video y audio
  • Tiene una ventana de contexto de 128K tokens, admite hasta 16K tokens de salida por solicitud y cuenta con conocimiento hasta octubre de 2023
  • Gracias al tokenizer mejorado que comparte con GPT-4o, el procesamiento de texto en idiomas distintos del inglés es más rentable

Rendimiento destacado de GPT-4o mini

  • GPT-4o mini supera a GPT-3.5 Turbo y a otros modelos pequeños tanto en inteligencia de texto como en razonamiento multimodal
  • Soporta la misma cobertura de idiomas que GPT-4o
  • Ofrece un excelente rendimiento en llamadas a funciones, lo que permite a los desarrolladores crear aplicaciones que recuperan datos de sistemas externos o ejecutan tareas
  • Mejora el rendimiento en contextos largos frente a GPT-3.5 Turbo
  • Logró 82.0% en MMLU, 87.0% en MGSM, 87.2% en HumanEval y 59.4% en MMMU, mostrando un rendimiento superior al de otros modelos pequeños

Medidas de seguridad

  • Durante el preentrenamiento, se filtra la información que no se desea que el modelo aprenda o genere (por ejemplo, discurso de odio, contenido para adultos, sitios que recopilan principalmente información personal, spam, etc.)
  • Durante el postentrenamiento, se usan técnicas como el aprendizaje por refuerzo con retroalimentación humana (RLHF) para alinear el comportamiento del modelo con las políticas y mejorar la precisión y confiabilidad de sus respuestas
  • GPT-4o mini incorpora las mismas mitigaciones de seguridad integradas que GPT-4o
  • Más de 70 expertos externos probaron GPT-4o para identificar riesgos potenciales, estos fueron abordados y se compartirán más detalles en la system card y la preparedness scorecard de GPT-4o
  • GPT-4o mini es el primer modelo de la API en aplicar el método de instruction hierarchy para mejorar su resistencia a jailbreaks, prompt injection y extracción del system prompt

Precio y disponibilidad

  • GPT-4o mini ya está disponible como modelo de texto y visión en la Assistants API, Chat Completions API y Batch API
  • Los desarrolladores pagan 15 centavos por 1 millón de tokens de entrada y 60 centavos por 1 millón de tokens de salida
  • En los próximos días se lanzará el fine-tuning para GPT-4o mini
  • Los usuarios de ChatGPT Free, Plus y Team pueden acceder desde hoy a GPT-4o mini en lugar de GPT-3.5
  • Los usuarios Enterprise también podrán acceder a partir de la próxima semana

Planes a futuro

  • Junto con los sorprendentes avances en la inteligencia de IA, se están logrando reducciones de costo significativas
  • El costo por token de GPT-4o mini es 99% menor que el de text-davinci-003, introducido en 2022
  • Se imagina un futuro en el que los modelos se integren de forma fluida en todas las apps y sitios web
  • GPT-4o mini abre el camino para que los desarrolladores construyan y escalen aplicaciones de IA potentes de manera más eficiente y económica
  • El futuro de la IA se está volviendo más accesible, confiable e integrado en nuestras experiencias digitales cotidianas

1 comentarios

 
wedding 2024-07-22

Parece que también saldrá gpt-4o pro max ultra.