- Se espera que GPT-4o mini haga que la inteligencia artificial sea mucho más económica y amplíe significativamente el rango de aplicaciones construidas con IA
- Obtuvo una puntuación de 82% en MMLU y actualmente supera a GPT-4 en preferencia de chat en el leaderboard de LMSYS
- Su precio es de 15 centavos por 1 millón de tokens de entrada y 60 centavos por 1 millón de tokens de salida, 10 veces más barato que el modelo de punta anterior y más de 60% más barato que GPT-3.5 Turbo
Funciones principales de GPT-4o mini
- Puede realizar una amplia variedad de tareas con bajo costo y baja latencia
- Es ideal para aplicaciones que encadenan o paralelizan múltiples llamadas al modelo (por ejemplo, varias llamadas a API)
- Es ideal para aplicaciones que pasan grandes cantidades de contexto al modelo (por ejemplo, una base de código completa o el historial de una conversación)
- Es ideal para aplicaciones que intercambian respuestas de texto rápidas y en tiempo real con clientes (por ejemplo, chatbots de soporte al cliente)
- Soporta texto y visión en la API, y en el futuro soportará entradas y salidas de texto, imagen, video y audio
- Tiene una ventana de contexto de 128K tokens, admite hasta 16K tokens de salida por solicitud y cuenta con conocimiento hasta octubre de 2023
- Gracias al tokenizer mejorado que comparte con GPT-4o, el procesamiento de texto en idiomas distintos del inglés es más rentable
Rendimiento destacado de GPT-4o mini
- GPT-4o mini supera a GPT-3.5 Turbo y a otros modelos pequeños tanto en inteligencia de texto como en razonamiento multimodal
- Soporta la misma cobertura de idiomas que GPT-4o
- Ofrece un excelente rendimiento en llamadas a funciones, lo que permite a los desarrolladores crear aplicaciones que recuperan datos de sistemas externos o ejecutan tareas
- Mejora el rendimiento en contextos largos frente a GPT-3.5 Turbo
- Logró 82.0% en MMLU, 87.0% en MGSM, 87.2% en HumanEval y 59.4% en MMMU, mostrando un rendimiento superior al de otros modelos pequeños
Medidas de seguridad
- Durante el preentrenamiento, se filtra la información que no se desea que el modelo aprenda o genere (por ejemplo, discurso de odio, contenido para adultos, sitios que recopilan principalmente información personal, spam, etc.)
- Durante el postentrenamiento, se usan técnicas como el aprendizaje por refuerzo con retroalimentación humana (RLHF) para alinear el comportamiento del modelo con las políticas y mejorar la precisión y confiabilidad de sus respuestas
- GPT-4o mini incorpora las mismas mitigaciones de seguridad integradas que GPT-4o
- Más de 70 expertos externos probaron GPT-4o para identificar riesgos potenciales, estos fueron abordados y se compartirán más detalles en la system card y la preparedness scorecard de GPT-4o
- GPT-4o mini es el primer modelo de la API en aplicar el método de instruction hierarchy para mejorar su resistencia a jailbreaks, prompt injection y extracción del system prompt
Precio y disponibilidad
- GPT-4o mini ya está disponible como modelo de texto y visión en la Assistants API, Chat Completions API y Batch API
- Los desarrolladores pagan 15 centavos por 1 millón de tokens de entrada y 60 centavos por 1 millón de tokens de salida
- En los próximos días se lanzará el fine-tuning para GPT-4o mini
- Los usuarios de ChatGPT Free, Plus y Team pueden acceder desde hoy a GPT-4o mini en lugar de GPT-3.5
- Los usuarios Enterprise también podrán acceder a partir de la próxima semana
Planes a futuro
- Junto con los sorprendentes avances en la inteligencia de IA, se están logrando reducciones de costo significativas
- El costo por token de GPT-4o mini es 99% menor que el de
text-davinci-003, introducido en 2022
- Se imagina un futuro en el que los modelos se integren de forma fluida en todas las apps y sitios web
- GPT-4o mini abre el camino para que los desarrolladores construyan y escalen aplicaciones de IA potentes de manera más eficiente y económica
- El futuro de la IA se está volviendo más accesible, confiable e integrado en nuestras experiencias digitales cotidianas
1 comentarios
Parece que también saldrá gpt-4o pro max ultra.