OpenAI presenta GPT-4o mini, su modelo pequeño más rentable

xguru · 2024-07-19T11:52:11+09:00

Se espera que GPT-4o mini haga que la inteligencia artificial sea mucho más económica y amplíe significativamente el rango de aplicaciones construidas con IA Obtuvo una puntuación de 82% en MMLU y actualmente supera a GPT-4 en preferencia de chat en el leaderboard de LMSYS Su precio es de 15 centavos por 1 millón de tokens de entrada y 60 centavos por 1 millón de tokens de salida, 10 veces más barato que el modelo de punta anterior y más de 60% más barato que GPT-3.5 Turbo Funciones principales de GPT-4o mini Puede realizar una amplia variedad de tareas con bajo costo y baja latencia Es ideal para aplicaciones que encadenan o paralelizan múltiples llamadas al modelo (por ejemplo, varias llamadas a API) Es ideal para aplicaciones que pasan grandes cantidades de contexto al modelo (por ejemplo, una base de código completa o el historial de una conversación) Es ideal para aplicaciones que intercambian respuestas de texto rápidas y en tiempo real con clientes (por ejemplo, chatbots de soporte al cliente) Soporta texto y visión en la API, y en el futuro soportará entradas y salidas de texto, imagen, video y audio Tiene una ventana de contexto de 128K tokens, admite hasta 16K tokens de salida por solicitud y cuenta con conocimiento hasta octubre de 2023 Gracias al tokenizer mejorado que comparte con GPT-4o, el procesamiento de texto en idiomas distintos del inglés es más rentable Rendimiento destacado de GPT-4o mini GPT-4o mini supera a GPT-3.5 Turbo y a otros modelos pequeños tanto en inteligencia de texto como en razonamiento multimodal Soporta la misma cobertura de idiomas que GPT-4o Ofrece un excelente rendimiento en llamadas a funciones, lo que permite a los desarrolladores crear aplicaciones que recuperan datos de sistemas externos o ejecutan tareas Mejora el rendimiento en contextos largos frente a GPT-3.5 Turbo Logró 82.0% en MMLU, 87.0% en MGSM, 87.2% en HumanEval y 59.4% en MMMU, mostrando un rendimiento superior al de otros modelos pequeños Medidas de seguridad Durante el preentrenamiento, se filtra la información que no se desea que el modelo aprenda o genere (por ejemplo, discurso de odio, contenido para adultos, sitios que recopilan principalmente información personal, spam, etc.) Durante el postentrenamiento, se usan técnicas como el aprendizaje por refuerzo con retroalimentación humana (RLHF) para alinear el comportamiento del modelo con las políticas y mejorar la precisión y confiabilidad de sus respuestas GPT-4o mini incorpora las mismas mitigaciones de seguridad integradas que GPT-4o Más de 70 expertos externos probaron GPT-4o para identificar riesgos potenciales, estos fueron abordados y se compartirán más detalles en la system card y la preparedness scorecard de GPT-4o GPT-4o mini es el primer modelo de la API en aplicar el método de instruction hierarchy para mejorar su resistencia a jailbreaks, prompt injection y extracción del system prompt Precio y disponibilidad GPT-4o mini ya está disponible como modelo de texto y visión en la Assistants API, Chat Completions API y Batch API Los desarrolladores pagan 15 centavos por 1 millón de tokens de entrada y 60 centavos por 1 millón de tokens de salida En los próximos días se lanzará el fine-tuning para GPT-4o mini Los usuarios de ChatGPT Free, Plus y Team pueden acceder desde hoy a GPT-4o mini en lugar de GPT-3.5 Los usuarios Enterprise también podrán acceder a partir de la próxima semana Planes a futuro Junto con los sorprendentes avances en la inteligencia de IA, se están logrando reducciones de costo significativas El costo por token de GPT-4o mini es 99% menor que el de text-davinci-003, introducido en 2022 Se imagina un futuro en el que los modelos se integren de forma fluida en todas las apps y sitios web GPT-4o mini abre el camino para que los desarrolladores construyan y escalen aplicaciones de IA potentes de manera más eficiente y económica El futuro de la IA se está volviendo más accesible, confiable e integrado en nuestras experiencias digitales cotidianas

(openai.com)

12 puntos por xguru 2024-07-19 | 1 comentarios | Compartir por WhatsApp

Se espera que GPT-4o mini haga que la inteligencia artificial sea mucho más económica y amplíe significativamente el rango de aplicaciones construidas con IA
Obtuvo una puntuación de 82% en MMLU y actualmente supera a GPT-4 en preferencia de chat en el leaderboard de LMSYS
Su precio es de 15 centavos por 1 millón de tokens de entrada y 60 centavos por 1 millón de tokens de salida, 10 veces más barato que el modelo de punta anterior y más de 60% más barato que GPT-3.5 Turbo

Funciones principales de GPT-4o mini

Puede realizar una amplia variedad de tareas con bajo costo y baja latencia
Es ideal para aplicaciones que encadenan o paralelizan múltiples llamadas al modelo (por ejemplo, varias llamadas a API)
Es ideal para aplicaciones que pasan grandes cantidades de contexto al modelo (por ejemplo, una base de código completa o el historial de una conversación)
Es ideal para aplicaciones que intercambian respuestas de texto rápidas y en tiempo real con clientes (por ejemplo, chatbots de soporte al cliente)
Soporta texto y visión en la API, y en el futuro soportará entradas y salidas de texto, imagen, video y audio
Tiene una ventana de contexto de 128K tokens, admite hasta 16K tokens de salida por solicitud y cuenta con conocimiento hasta octubre de 2023
Gracias al tokenizer mejorado que comparte con GPT-4o, el procesamiento de texto en idiomas distintos del inglés es más rentable

Rendimiento destacado de GPT-4o mini

GPT-4o mini supera a GPT-3.5 Turbo y a otros modelos pequeños tanto en inteligencia de texto como en razonamiento multimodal
Soporta la misma cobertura de idiomas que GPT-4o
Ofrece un excelente rendimiento en llamadas a funciones, lo que permite a los desarrolladores crear aplicaciones que recuperan datos de sistemas externos o ejecutan tareas
Mejora el rendimiento en contextos largos frente a GPT-3.5 Turbo
Logró 82.0% en MMLU, 87.0% en MGSM, 87.2% en HumanEval y 59.4% en MMMU, mostrando un rendimiento superior al de otros modelos pequeños

Medidas de seguridad

Durante el preentrenamiento, se filtra la información que no se desea que el modelo aprenda o genere (por ejemplo, discurso de odio, contenido para adultos, sitios que recopilan principalmente información personal, spam, etc.)
Durante el postentrenamiento, se usan técnicas como el aprendizaje por refuerzo con retroalimentación humana (RLHF) para alinear el comportamiento del modelo con las políticas y mejorar la precisión y confiabilidad de sus respuestas
GPT-4o mini incorpora las mismas mitigaciones de seguridad integradas que GPT-4o
Más de 70 expertos externos probaron GPT-4o para identificar riesgos potenciales, estos fueron abordados y se compartirán más detalles en la system card y la preparedness scorecard de GPT-4o
GPT-4o mini es el primer modelo de la API en aplicar el método de instruction hierarchy para mejorar su resistencia a jailbreaks, prompt injection y extracción del system prompt

Precio y disponibilidad

GPT-4o mini ya está disponible como modelo de texto y visión en la Assistants API, Chat Completions API y Batch API
Los desarrolladores pagan 15 centavos por 1 millón de tokens de entrada y 60 centavos por 1 millón de tokens de salida
En los próximos días se lanzará el fine-tuning para GPT-4o mini
Los usuarios de ChatGPT Free, Plus y Team pueden acceder desde hoy a GPT-4o mini en lugar de GPT-3.5
Los usuarios Enterprise también podrán acceder a partir de la próxima semana

Planes a futuro

Junto con los sorprendentes avances en la inteligencia de IA, se están logrando reducciones de costo significativas
El costo por token de GPT-4o mini es 99% menor que el de text-davinci-003, introducido en 2022
Se imagina un futuro en el que los modelos se integren de forma fluida en todas las apps y sitios web
GPT-4o mini abre el camino para que los desarrolladores construyan y escalen aplicaciones de IA potentes de manera más eficiente y económica
El futuro de la IA se está volviendo más accesible, confiable e integrado en nuestras experiencias digitales cotidianas

1 comentarios

wedding 2024-07-22

Parece que también saldrá gpt-4o pro max ultra.