OpenAI y Apple anuncian una alianza
(openai.com)- Apple integrará ChatGPT en iOS, iPadOS y macOS para que los usuarios puedan usar incluso funciones de comprensión de imágenes y documentos sin cambiar de app
- Siri usará ChatGPT cuando sea necesario, y antes de enviar preguntas, documentos o fotos primero pedirá confirmación del usuario
- ChatGPT también se integra en las Writing Tools de todo el sistema para ofrecer ayuda de redacción y generación de imágenes en distintos estilos
- En Siri y Writing Tools, OpenAI no almacenará las solicitudes y ocultará las direcciones IP; si se vincula una cuenta, se aplicará la configuración de datos de la cuenta de ChatGPT
- La integración basada en GPT‑4o llegará a iOS, iPadOS y macOS a finales de este año, con soporte tanto para uso gratuito sin iniciar sesión como para acceso a funciones de pago para suscriptores
ChatGPT llega a la experiencia de Apple
- Apple integrará ChatGPT en la experiencia de usuario de iOS, iPadOS y macOS
- Los usuarios podrán usar las funciones de ChatGPT sin tener que ir a una herramienta aparte
- Las funciones integradas incluyen comprensión de imágenes y documentos
- Siri usará ChatGPT cuando resulte útil
- Antes de que preguntas, documentos o fotos se envíen a ChatGPT, Apple primero pedirá la confirmación del usuario
- Siri mostrará directamente las respuestas de ChatGPT
- ChatGPT también podrá usarse en las Writing Tools de todo el sistema
- Podrá ayudar a generar contenido según el tema que se esté redactando
- Con la herramienta de imágenes de ChatGPT, se podrán crear imágenes en varios estilos para complementar el texto
Forma de disponibilidad y protección de la privacidad
- Al acceder a ChatGPT desde Siri y Writing Tools, se aplicarán medidas de protección de la privacidad
- OpenAI no almacenará las solicitudes
- La dirección IP del usuario se ocultará
- Los usuarios podrán vincular su cuenta de ChatGPT
- Si vinculan su cuenta, la configuración de datos del usuario se aplicará según las políticas de ChatGPT
- La integración está basada en GPT‑4o y estará disponible en iOS, iPadOS y macOS a finales de este año
- Se podrá acceder gratis sin crear una cuenta
- Los suscriptores de ChatGPT podrán vincular su cuenta y usar funciones de pago dentro de esa experiencia
- Esta alianza está alineada con la misión de OpenAI de hacer que la IA avanzada sea accesible para todos
1 comentarios
Opiniones de Hacker News
Esto se siente parecido a la integración de Facebook/Twitter en los primeros iOS. Fue una función que duró apenas unos años.
Apple parece considerar que por ahora necesita un servicio dedicado de modelos de lenguaje grandes, pero procesa por su cuenta muchas de las funciones centrales y exige consentimiento explícito para usar OpenAI. Viendo que dijeron que también agregarán otros modelos, parece que en parte ven a OpenAI como una commodity, y no se siente como un contrato a 10 años.
Los modelos de lenguaje grandes no son precisos, ni son expertos de dominio que acierten con un margen de error menor al 5%. La gente lo irá entendiendo, y como es muy probable que el costo de mantener los modelos actualizados y operarlos no baje de forma drástica, al final la burbuja se desinflará.
El objetivo final de Apple probablemente sea mover tantas funciones de IA como sea posible al dispositivo.
Ojalá pasaran más cosas así. Las big tech llevan demasiado tiempo frenando la innovación.
Solo que esta vez parece que quien recibe el cheque grande será OpenAI.
El acceso a GPT-4o es una función cómoda, pero lo que realmente quería escuchar era si había mejorado la comprensión del lenguaje de Siri.
En esta presentación de WWDC mostraron algunos ejemplos en los que Siri mantiene el contexto y entiende quién es “ella” en pedidos como “agrega la hora de llegada de su vuelo a mi calendario”. Pero en el uso cotidiano, Siri no tiene una comprensión del lenguaje al nivel de los modelos de lenguaje grandes y sigue sintiéndose como un hack ingenioso estilo Eliza ajustado a frases predefinidas. Pedidos como “reproduce la canción que sonó justo antes de la que te dije que saltaras” GPT-4o los maneja fácilmente, pero Siri parecía no entenderlos. Me da curiosidad hasta qué punto se actualizará el modelo de lenguaje base de Siri.
Creo que Apple también hizo una demo preguntando por el clima en la que la presentadora cambiaba la frase a mitad de oración, y espero que eso haya sido una señal de que incorporaron modelos de lenguaje grandes para interpretar la intención de las solicitudes del usuario.
En cambio, en los últimos meses la app de ChatGPT, incluso en entornos ruidosos, convierte voz a texto con menos de 5% de errores si hablas de forma natural, y aunque haya errores de transcripción entiende correctamente la intención real. Para hacer un asistente de voz mucho mejor bastaría con darle a GPT-4 las especificaciones de las funciones que puede ejecutar en el teléfono e integrarlo con el sistema operativo; me pregunto por qué ninguna empresa lo hizo bien. También me sorprende que OpenAI no haya extendido la app de ChatGPT en esa dirección.
Hablaron de nuevas funciones de transcripción de voz, la capacidad de corregirse a mitad de una frase y una comprensión profunda del contexto personal. Parece una gran actualización que aplica modelos de IA generativa de forma más amplia, incluso a cosas como la clasificación de fotos, pero habrá que ver cómo funciona en la práctica.
Esto es casi exactamente lo que quería. Hay muchas preguntas que quisiera hacerle a Siri en el auto, pero que no puede procesar.
Por ejemplo: “¿en qué estado estoy ahora, cuánto falta para la próxima frontera estatal y puedo cargar gasolina yo mismo en cada estado por el que voy a pasar?”. Aunque esto depende en cierta medida de si puede extraer información de Google Maps.
Dijeron que Apple Intelligence funciona de una manera más local y personalizada, tomando en cuenta datos como la ubicación actual y el calendario. Hay una API mediante la cual las apps exponen “intenciones”, y Siri puede combinarlas para atender pedidos como “el precio de la gasolina en la estación más cercana”. Según la keynote, esa parte no es de OpenAI.
Creo que la mayoría de eso podría reformularse como “¿cuál es mi ubicación actual?”, “muéstrame el mapa”, “¿en qué estados está prohibido cargar gasolina uno mismo?”.
Integrar OpenAI como una dependencia de terceros a nivel de todo el sistema y disponible gratis para todos los usuarios es una señal interesante de bastante confianza en la madurez de OpenAI, tanto en escala como en tecnología.
OpenAI es una empresa polémica, y también hay buenos competidores como Anthropic que parecen encajar mejor en términos de alineación de marca. Por eso este acuerdo se siente raro
Aunque Anthropic fuera 10 veces mejor, para los clientes y los inversionistas del mercado público quizá no importe tanto como el nombre “ChatGPT”. Google ganó en búsqueda no solo porque durante un tiempo fue el mejor motor de búsqueda, sino porque la cobertura interminable de la prensa convirtió la marca en un verbo cotidiano. “Pregúntale a ChatGPT” tiene muchas probabilidades de convertirse en el “googlealo” de la IA, y la controversia mediática alrededor de OpenAI no hace más que consolidar más esa posición
Dejé de usar GPT-4 porque se extendía demasiado con cosas que no quería. Claude 3 responde de forma más parecida a la información que daría una persona y, al tener menos tonterías innecesarias, se siente más humano. Para cuando salga a fines de este año ni siquiera sabemos qué modelo será el mejor, y ya vimos lo rápido que los modelos de código abierto alcanzaron a GPT-4; no entiendo por qué apostar solo por el modelo de una empresa
Me sorprendió lo poco que Apple depende de OpenAI. La mayoría de las integraciones impresionantes que parecen realmente útiles corren en el dispositivo o en la nube privada de Apple
El ChatGPT de OpenAI se siente relegado a un rincón de Siri para responder “preguntas estilo Google” cuando el usuario lo autoriza. Que no tenga un papel más grande en la arquitectura parece una desventaja para OpenAI y, personalmente, me alegra
En la práctica, se sintió como una integración de relleno para poder decir que el iPhone tiene acceso a modelos de última generación. Personalmente, me parecen mucho más interesantes la integración profunda con el ecosistema y la indexación semántica
Todavía no conozco a nadie que quiera esto. No quiero IA en mi navegador web, ni en mi cliente de correo, ni en mi teléfono
Cuando le pregunto a la gente a mi alrededor, todos parecen estar más o menos de acuerdo, así que no sé para quién es esto
Con GPT-3 no era muy bueno, pero 4o, o el modelo más reciente, hace ese trabajo realmente bien. Básicamente es fuerte en tareas de “trasladar el estilo de una cosa a otra”. Pero cuando le preguntaba datos que no encontraba en Google, siempre se equivocaba de forma ridícula
Pero hasta ahora las empresas todavía parecen estar buscando el rumbo, tirando todo contra la pared para ver qué se pega. Espero que, cuando esto se ordene en 2 o 3 años, podamos tener un gran asistente virtual
Puede que haya algunos casos de uso legítimos, pero, como siempre, parece que todos se lanzan de más sin pensarlo lo suficiente
También, cuando empiezo una lluvia de ideas o una investigación, abro ChatGPT en modo voz y voy hablando, mientras al mismo tiempo abro el navegador para verificar los datos de lo que devuelve
Así no tengo que ponerme a revisar correos y perder el contexto que tengo en la cabeza
Esto se ve bien, pero en realidad podría ser una amenaza existencial para OpenAI
Cuando tienes un único cliente enorme, ese cliente termina teniendo demasiado poder sobre el negocio. Apple algún día podría simplemente negarse a pagar, y tiene recursos para aguantar aunque una demanda dure años. La razón por la que Benjamin Moore no vende en Home Depot ni Lowe’s y mantiene sus propias tiendas también es que los grandes clientes pueden imponer condiciones. Apple incluso diseñó sus propios chips para acelerar el procesamiento de aprendizaje automático, y la alianza con OpenAI es claramente una solución temporal. Si tiene oportunidad, debilitará a OpenAI y, cuando pueda, la reemplazará. A Apple no le gusta depender de socios para funciones centrales; por eso abandonó Google Maps y se pasó a Apple Maps aunque todavía esté por detrás. Y si no reemplaza a Google Search es porque Google le paga una fortuna y Apple todavía no ha logrado sustituirlo. Para OpenAI parece una buena jugada, pero es como meter al zorro en el gallinero
Eso de que Apple no pague y aguante con demandas también lo podrían hacer OpenAI y Microsoft, y Microsoft estaría feliz si pudiera perjudicar a Apple. Tampoco hay antecedentes de que Apple se haya comportado así con proveedores que usa. Lo de Benjamin Moore también se explica porque Home Depot tiene su propia marca, Behr, y en cada color de Behr indica qué color de Benjamin Moore copió, llevándose ventas como sustituto. También me gustaría saber cómo defines que Apple Maps “todavía está por detrás”, cuántas veces al día usas Apple Maps y si existe algún benchmark que compare ambos servicios
Más bien, el acuerdo con Apple es la primera señal de que OpenAI no es, en la práctica, una subsidiaria de Microsoft
OpenAI probablemente cree que una IA suficientemente inteligente, es decir AGI o ASI, resolverá problemas mucho más grandes o creará, en la práctica, una plataforma de cómputo completamente nueva. De hecho, incluso ChatGPT, que hoy es un modelo de lenguaje grande con muchas limitaciones, casi parece su propia plataforma de cómputo. Apple está acelerando la velocidad con la que la gente se acostumbra a interactuar con agentes sin apps ni dispositivos elegantes. Si la IA de verdad llega a ser lo suficientemente buena, no sé quién va a necesitar a Apple dentro de 10 o 15 años
“Al acceder a ChatGPT desde Siri y Writing Tools, la protección de privacidad está integrada: las solicitudes no se almacenan en OpenAI y la dirección IP del usuario se oculta. Los usuarios también pueden vincular una cuenta de ChatGPT; en ese caso, la configuración de datos se rige por la política de ChatGPT”
Entonces, ¿significa que, por defecto, las solicitudes de ChatGPT de un usuario común de Apple no se usan para el entrenamiento de OpenAI, pero las de un cliente de pago de ChatGPT Plus sí podrían usarse? También me da curiosidad si vincular una cuenta de ChatGPT Plus implica que mis datos se usarán para entrenamiento. Se siente raro que el estándar de privacidad para los clientes de pago sea más bajo que el de los usuarios que llegan por la alianza. Claro, sé que se puede impedir el uso para entrenamiento con la función “Temporary Chat” o desactivando la memoria.
“Para desactivar el entrenamiento del modelo, ve a Settings > Data Controls desde el ícono de perfil en la parte inferior izquierda de la página y desactiva ‘Improve the model for everyone’. Cuando esta opción está desactivada, las conversaciones nuevas no se usan para entrenar el modelo”