- Se presentaron el modelo GPT-4 Turbo con soporte para una ventana de contexto de 128K, la API de GPT-4 con Vision, la Assistants API, la API de DALL-E 3 y el nuevo GPT-3.5 Turbo.
- GPT-4 Turbo
- Soporta una ventana de contexto (Context Window) de 128K y fue entrenado con datos hasta abril de 2023.
- En comparación con GPT-4, los tokens de entrada son 3 veces más baratos y los tokens de salida 2 veces más baratos.
- Sigue mejor las instrucciones para responder en formatos específicos, y también incluye un modo JSON que garantiza respuestas en JSON.
- Soporta salidas reproducibles basadas en
seed y se planea agregar una función para devolver probabilidades logarítmicas de la salida.
- GPT-3.5 Turbo también fue actualizado.
- Assistants API
- IA de propósito específico con funciones de intérprete de código, búsqueda y llamadas a funciones.
- Gestiona el estado con base en hilos, por lo que puede manejar contenido de longitud indefinida.
- Intérprete de código: permite escribir y ejecutar código Python en un entorno sandbox.
- Búsqueda: busca y responde usando conocimiento externo al modelo, como documentos proporcionados por el usuario.
- Llamadas a funciones: puede invocar adecuadamente funciones definidas por el usuario e incluir los resultados en la respuesta.
- Otras APIs nuevas
- Se añadió a GPT-4 Turbo la capacidad de reconocer imágenes.
- DALL-E 3 se lanzó como API, con un costo de 0.04 dólares por imagen generada.
- Se añadió una API de TTS.
- Personalización de modelos
- El modelo de ajuste fino de GPT-4 estará disponible en acceso experimental.
- Se ofrece un servicio de modelos personalizados para crear modelos a medida para grandes organizaciones.
- Incluye entrenamiento con conjuntos de datos propietarios de decenas de miles de millones de tokens o más.
- Reducción de precios
- GPT-4 Turbo 128K cuesta 0.01 dólares por token de entrada y 0.03 dólares por token de salida.
- En comparación con antes, los tokens de entrada ahora son 3 veces más baratos y los de salida 2 veces más baratos.
- GPT-3.5 Turbo 16K se ofrece a 0.001 dólares por token de entrada y 0.002 dólares por token de salida.
- En comparación con antes, los tokens de entrada ahora son 3 veces más baratos y los de salida 2 veces más baratos, y además los tokens de entrada son 33% más baratos que en el modelo 4K.
- El modelo de ajuste fino de GPT-3.5 Turbo se ofrece a 0.003 dólares por token de entrada y 0.006 dólares por token de salida.
- En comparación con antes, los tokens de entrada ahora son 4 veces más baratos y los de salida 2.7 veces más baratos.
8 comentarios
Desde ayer también apliqué GPT-4 Turbo en GN⁺.
Definitivamente responde más rápido y entiende mejor las instrucciones.
Resume bien tal como se le indica y también entrega resultados más limpios.
Antes mezclaba prompts en inglés, pero ahora incluso solo con prompts en coreano da respuestas excelentes.
No sé mucho de IA, pero la velocidad de la caída de precios seguramente se acelerará cada vez más, ¿no? De verdad no puedo imaginar cómo será el mundo dentro de 1 o 2 años.
El precio indicado por token es el precio por 1000 tokens. Tenlo en cuenta.
Y con 128K tokens... ahora, para los usos que yo le doy, normalmente ya desaparecerán los problemas de contexto.
Ah, estaba organizando esto para publicarlo, pero se me hizo tarde T_T
Cuando Anthropic presentó el modelo de 100K ya me pareció impresionante, pero ahora GPT-4 vuelve a ponerse por delante al anunciar 128K tokens.
También bajaron los precios varias veces en general, así que hasta dónde llega la capacidad técnica de OpenAI...
En fin, es totalmente bienvenido.
GPT-4 era discretamente caro (sobre todo si usabas 16K), pero ahora aumentaron muchísimo el tamaño de tokens y de verdad se abarató bastante. +_+
Y también me da curiosidad la Assistants API, creo que tendré que probarla.
Dicen que ya no hace falta usar embeddings para búsqueda, así que hasta parece más conveniente...?
Resumen de IA del hilo de HN.
Hay una alucinación ahí.
Los precios ya están todos escritos.