9 puntos por kuroneko 2023-11-07 | 8 comentarios | Compartir por WhatsApp
  • Se presentaron el modelo GPT-4 Turbo con soporte para una ventana de contexto de 128K, la API de GPT-4 con Vision, la Assistants API, la API de DALL-E 3 y el nuevo GPT-3.5 Turbo.
  • GPT-4 Turbo
    • Soporta una ventana de contexto (Context Window) de 128K y fue entrenado con datos hasta abril de 2023.
    • En comparación con GPT-4, los tokens de entrada son 3 veces más baratos y los tokens de salida 2 veces más baratos.
    • Sigue mejor las instrucciones para responder en formatos específicos, y también incluye un modo JSON que garantiza respuestas en JSON.
    • Soporta salidas reproducibles basadas en seed y se planea agregar una función para devolver probabilidades logarítmicas de la salida.
    • GPT-3.5 Turbo también fue actualizado.
  • Assistants API
    • IA de propósito específico con funciones de intérprete de código, búsqueda y llamadas a funciones.
    • Gestiona el estado con base en hilos, por lo que puede manejar contenido de longitud indefinida.
    • Intérprete de código: permite escribir y ejecutar código Python en un entorno sandbox.
    • Búsqueda: busca y responde usando conocimiento externo al modelo, como documentos proporcionados por el usuario.
    • Llamadas a funciones: puede invocar adecuadamente funciones definidas por el usuario e incluir los resultados en la respuesta.
  • Otras APIs nuevas
    • Se añadió a GPT-4 Turbo la capacidad de reconocer imágenes.
    • DALL-E 3 se lanzó como API, con un costo de 0.04 dólares por imagen generada.
    • Se añadió una API de TTS.
  • Personalización de modelos
    • El modelo de ajuste fino de GPT-4 estará disponible en acceso experimental.
    • Se ofrece un servicio de modelos personalizados para crear modelos a medida para grandes organizaciones.
      • Incluye entrenamiento con conjuntos de datos propietarios de decenas de miles de millones de tokens o más.
  • Reducción de precios
    • GPT-4 Turbo 128K cuesta 0.01 dólares por token de entrada y 0.03 dólares por token de salida.
      • En comparación con antes, los tokens de entrada ahora son 3 veces más baratos y los de salida 2 veces más baratos.
    • GPT-3.5 Turbo 16K se ofrece a 0.001 dólares por token de entrada y 0.002 dólares por token de salida.
      • En comparación con antes, los tokens de entrada ahora son 3 veces más baratos y los de salida 2 veces más baratos, y además los tokens de entrada son 33% más baratos que en el modelo 4K.
    • El modelo de ajuste fino de GPT-3.5 Turbo se ofrece a 0.003 dólares por token de entrada y 0.006 dólares por token de salida.
      • En comparación con antes, los tokens de entrada ahora son 4 veces más baratos y los de salida 2.7 veces más baratos.

8 comentarios

 
xguru 2023-11-10

Desde ayer también apliqué GPT-4 Turbo en GN⁺.
Definitivamente responde más rápido y entiende mejor las instrucciones.
Resume bien tal como se le indica y también entrega resultados más limpios.
Antes mezclaba prompts en inglés, pero ahora incluso solo con prompts en coreano da respuestas excelentes.

 
botplaysdice 2023-11-08

No sé mucho de IA, pero la velocidad de la caída de precios seguramente se acelerará cada vez más, ¿no? De verdad no puedo imaginar cómo será el mundo dentro de 1 o 2 años.

 
tkwlsrl 2023-11-07

El precio indicado por token es el precio por 1000 tokens. Tenlo en cuenta.

 
shw00 2023-11-07

Y con 128K tokens... ahora, para los usos que yo le doy, normalmente ya desaparecerán los problemas de contexto.

 
xguru 2023-11-07

Ah, estaba organizando esto para publicarlo, pero se me hizo tarde T_T

 
kuroneko 2023-11-07

Cuando Anthropic presentó el modelo de 100K ya me pareció impresionante, pero ahora GPT-4 vuelve a ponerse por delante al anunciar 128K tokens.
También bajaron los precios varias veces en general, así que hasta dónde llega la capacidad técnica de OpenAI...

En fin, es totalmente bienvenido.
GPT-4 era discretamente caro (sobre todo si usabas 16K), pero ahora aumentaron muchísimo el tamaño de tokens y de verdad se abarató bastante. +_+

Y también me da curiosidad la Assistants API, creo que tendré que probarla.
Dicen que ya no hace falta usar embeddings para búsqueda, así que hasta parece más conveniente...?

 
kuroneko 2023-11-07

Resumen de IA del hilo de HN.

  • OpenAI anunció nuevos modelos y productos para desarrolladores, incluyendo GPT-4 Turbo con una longitud de contexto de 128,000 tokens, la API de Assistants y precios más bajos.
  • Estos anuncios buscan aumentar el lock-in a la plataforma de API de OpenAI en un contexto de competencia cada vez más intensa.
  • Los agentes GPT y los assistants funcionan como una "caja negra dentro de otra caja negra" que no se puede portar a otros lugares.
  • El precio de DALL-E 3 es de 0.04 dólares por imagen, 10 veces más alto que el de sus competidores.
  • El precio de ChatGPT 3.5 con fine-tuning ahora es 3 veces mayor, lo que hace que el ajuste fino resulte aún más atractivo.
  • La longitud de contexto de 128K de GPT-4 Turbo es atractiva, pero los modelos open source todavía se quedan atrás en precisión y capacidades.
  • Ahora los clientes pueden pagar entre 2 y 3 millones de dólares para preentrenar modelos GPT-N personalizados con datos propietarios.
  • Categorías de startups como vectorDB y procesamiento de archivos podrían verse afectadas a medida que OpenAI ofrece funciones similares.
  • OpenAI intenta hacer que los desarrolladores dependan de su plataforma sin considerar los riesgos a largo plazo.
  • A medida que disminuye la competencia, los desarrolladores aceptarán riesgos como el lock-in basándose en sus necesidades actuales y beneficios de corto plazo.
 
brainer 2023-11-07

Hay una alucinación ahí.

Los precios ya están todos escritos.