1 puntos por GN⁺ 2024-06-11 | 1 comentarios | Compartir por WhatsApp
  • Apple integrará ChatGPT en iOS, iPadOS y macOS para que los usuarios puedan usar incluso funciones de comprensión de imágenes y documentos sin cambiar de app
  • Siri usará ChatGPT cuando sea necesario, y antes de enviar preguntas, documentos o fotos primero pedirá confirmación del usuario
  • ChatGPT también se integra en las Writing Tools de todo el sistema para ofrecer ayuda de redacción y generación de imágenes en distintos estilos
  • En Siri y Writing Tools, OpenAI no almacenará las solicitudes y ocultará las direcciones IP; si se vincula una cuenta, se aplicará la configuración de datos de la cuenta de ChatGPT
  • La integración basada en GPT‑4o llegará a iOS, iPadOS y macOS a finales de este año, con soporte tanto para uso gratuito sin iniciar sesión como para acceso a funciones de pago para suscriptores

ChatGPT llega a la experiencia de Apple

  • Apple integrará ChatGPT en la experiencia de usuario de iOS, iPadOS y macOS
    • Los usuarios podrán usar las funciones de ChatGPT sin tener que ir a una herramienta aparte
    • Las funciones integradas incluyen comprensión de imágenes y documentos
  • Siri usará ChatGPT cuando resulte útil
    • Antes de que preguntas, documentos o fotos se envíen a ChatGPT, Apple primero pedirá la confirmación del usuario
    • Siri mostrará directamente las respuestas de ChatGPT
  • ChatGPT también podrá usarse en las Writing Tools de todo el sistema
    • Podrá ayudar a generar contenido según el tema que se esté redactando
    • Con la herramienta de imágenes de ChatGPT, se podrán crear imágenes en varios estilos para complementar el texto

Forma de disponibilidad y protección de la privacidad

  • Al acceder a ChatGPT desde Siri y Writing Tools, se aplicarán medidas de protección de la privacidad
    • OpenAI no almacenará las solicitudes
    • La dirección IP del usuario se ocultará
  • Los usuarios podrán vincular su cuenta de ChatGPT
    • Si vinculan su cuenta, la configuración de datos del usuario se aplicará según las políticas de ChatGPT
  • La integración está basada en GPT‑4o y estará disponible en iOS, iPadOS y macOS a finales de este año
    • Se podrá acceder gratis sin crear una cuenta
    • Los suscriptores de ChatGPT podrán vincular su cuenta y usar funciones de pago dentro de esa experiencia
  • Esta alianza está alineada con la misión de OpenAI de hacer que la IA avanzada sea accesible para todos

1 comentarios

 
GN⁺ 2024-06-11
Opiniones de Hacker News
  • Esto se siente parecido a la integración de Facebook/Twitter en los primeros iOS. Fue una función que duró apenas unos años.
    Apple parece considerar que por ahora necesita un servicio dedicado de modelos de lenguaje grandes, pero procesa por su cuenta muchas de las funciones centrales y exige consentimiento explícito para usar OpenAI. Viendo que dijeron que también agregarán otros modelos, parece que en parte ven a OpenAI como una commodity, y no se siente como un contrato a 10 años.

    • De acuerdo. Por ahora lo usarán porque les conviene, pero en unos 3 años me imagino que criticarán públicamente a OpenAI por no proteger lo suficiente la privacidad de los datos y actuarán como si nunca hubieran tenido relación alguna.
    • Creo que en 3 a 5 años montones de cajas de IA y esos íconos brillantes para invocar IA junto a los campos de entrada desaparecerán silenciosamente.
      Los modelos de lenguaje grandes no son precisos, ni son expertos de dominio que acierten con un margen de error menor al 5%. La gente lo irá entendiendo, y como es muy probable que el costo de mantener los modelos actualizados y operarlos no baje de forma drástica, al final la burbuja se desinflará.
    • Por intuición, parece una solución temporal para implementar la experiencia de usuario que Apple quiere.
      El objetivo final de Apple probablemente sea mover tantas funciones de IA como sea posible al dispositivo.
    • Hay muchas cosas que no me gustan de Sam Altman ni de OpenAI, pero es realmente sorprendente que OpenAI haya superado por completo a Google y Apple, y que empresas valuadas en billones estén intentando alcanzar a una startup.
      Ojalá pasaran más cosas así. Las big tech llevan demasiado tiempo frenando la innovación.
    • No estoy de acuerdo. Esto se parece más a la alianza de Safari con Google, que lleva mucho tiempo.
      Solo que esta vez parece que quien recibe el cheque grande será OpenAI.
  • El acceso a GPT-4o es una función cómoda, pero lo que realmente quería escuchar era si había mejorado la comprensión del lenguaje de Siri.
    En esta presentación de WWDC mostraron algunos ejemplos en los que Siri mantiene el contexto y entiende quién es “ella” en pedidos como “agrega la hora de llegada de su vuelo a mi calendario”. Pero en el uso cotidiano, Siri no tiene una comprensión del lenguaje al nivel de los modelos de lenguaje grandes y sigue sintiéndose como un hack ingenioso estilo Eliza ajustado a frases predefinidas. Pedidos como “reproduce la canción que sonó justo antes de la que te dije que saltaras” GPT-4o los maneja fácilmente, pero Siri parecía no entenderlos. Me da curiosidad hasta qué punto se actualizará el modelo de lenguaje base de Siri.

    • Ese es justamente el mayor punto de frustración con los asistentes de voz actuales. Por suerte, la tecnología para interpretar pedidos complejos o ambiguos ya llegó con ChatGPT.
      Creo que Apple también hizo una demo preguntando por el clima en la que la presentadora cambiaba la frase a mitad de oración, y espero que eso haya sido una señal de que incorporaron modelos de lenguaje grandes para interpretar la intención de las solicitudes del usuario.
    • Los asistentes de voz existentes, en general, son todos pésimos. Sea como sea Siri, Google Assistant es peor.
      En cambio, en los últimos meses la app de ChatGPT, incluso en entornos ruidosos, convierte voz a texto con menos de 5% de errores si hablas de forma natural, y aunque haya errores de transcripción entiende correctamente la intención real. Para hacer un asistente de voz mucho mejor bastaría con darle a GPT-4 las especificaciones de las funciones que puede ejecutar en el teléfono e integrarlo con el sistema operativo; me pregunto por qué ninguna empresa lo hizo bien. También me sorprende que OpenAI no haya extendido la app de ChatGPT en esa dirección.
    • Me parece que Cortana ya hacía este tipo de manejo de contexto. Para 2024, esto se siente bastante tibio.
    • En la keynote de Apple sonó como que Siri recibirá una actualización importante basada en Apple Intelligence, no como que le están pegando a la fuerza funciones de contexto al modelo viejo de Siri.
      Hablaron de nuevas funciones de transcripción de voz, la capacidad de corregirse a mitad de una frase y una comprensión profunda del contexto personal. Parece una gran actualización que aplica modelos de IA generativa de forma más amplia, incluso a cosas como la clasificación de fotos, pero habrá que ver cómo funciona en la práctica.
    • Apple lleva bastante tiempo afirmando que puede hacer cosas así. Ahora mismo no me dan muchas ganas de creerles.
  • Esto es casi exactamente lo que quería. Hay muchas preguntas que quisiera hacerle a Siri en el auto, pero que no puede procesar.
    Por ejemplo: “¿en qué estado estoy ahora, cuánto falta para la próxima frontera estatal y puedo cargar gasolina yo mismo en cada estado por el que voy a pasar?”. Aunque esto depende en cierta medida de si puede extraer información de Google Maps.

    • La mayor parte de eso probablemente pasará por Apple Intelligence, no por ChatGPT.
      Dijeron que Apple Intelligence funciona de una manera más local y personalizada, tomando en cuenta datos como la ubicación actual y el calendario. Hay una API mediante la cual las apps exponen “intenciones”, y Siri puede combinarlas para atender pedidos como “el precio de la gasolina en la estación más cercana”. Según la keynote, esa parte no es de OpenAI.
    • Actualmente, las funciones de Siri en CarPlay están bastante limitadas. A menudo no responde preguntas más complejas que sí podría contestar si no estuviera en CarPlay.
    • Me da curiosidad qué tipo de viaje requiere preguntar “¿en qué estado estoy ahora, cuánto falta para la próxima frontera estatal y puedo cargar gasolina yo mismo en cada estado por el que voy a pasar?”.
      Creo que la mayoría de eso podría reformularse como “¿cuál es mi ubicación actual?”, “muéstrame el mapa”, “¿en qué estados está prohibido cargar gasolina uno mismo?”.
    • Pensé que Oregon era el único estado donde por ley te tiene que cargar la gasolina un empleado.
    • Claro, esto solo funcionará cuando uses Apple Maps.
  • Integrar OpenAI como una dependencia de terceros a nivel de todo el sistema y disponible gratis para todos los usuarios es una señal interesante de bastante confianza en la madurez de OpenAI, tanto en escala como en tecnología.

    • “Interesante” es exactamente la palabra. La estabilidad de OpenAI es peor incluso que la de una startup típica de dos personas, pero su calidad de machine learning es así de buena.
  • OpenAI es una empresa polémica, y también hay buenos competidores como Anthropic que parecen encajar mejor en términos de alineación de marca. Por eso este acuerdo se siente raro

    • OpenAI/ChatGPT es el único nombre ampliamente conocido por el público en IA
      Aunque Anthropic fuera 10 veces mejor, para los clientes y los inversionistas del mercado público quizá no importe tanto como el nombre “ChatGPT”. Google ganó en búsqueda no solo porque durante un tiempo fue el mejor motor de búsqueda, sino porque la cobertura interminable de la prensa convirtió la marca en un verbo cotidiano. “Pregúntale a ChatGPT” tiene muchas probabilidades de convertirse en el “googlealo” de la IA, y la controversia mediática alrededor de OpenAI no hace más que consolidar más esa posición
    • Los modelos de Anthropic son mejores para este tipo de tareas, así que resulta aún más raro. Siento que las respuestas de Claude casi siempre son mejores que las de GPT-4
      Dejé de usar GPT-4 porque se extendía demasiado con cosas que no quería. Claude 3 responde de forma más parecida a la información que daría una persona y, al tener menos tonterías innecesarias, se siente más humano. Para cuando salga a fines de este año ni siquiera sabemos qué modelo será el mejor, y ya vimos lo rápido que los modelos de código abierto alcanzaron a GPT-4; no entiendo por qué apostar solo por el modelo de una empresa
    • OpenAI no parece tener activos de valor especialmente alto. Ahora está entregando toda la tienda para quedarse con el flujo de entrada, y creo que este juego insostenible pronto terminará mal
  • Me sorprendió lo poco que Apple depende de OpenAI. La mayoría de las integraciones impresionantes que parecen realmente útiles corren en el dispositivo o en la nube privada de Apple
    El ChatGPT de OpenAI se siente relegado a un rincón de Siri para responder “preguntas estilo Google” cuando el usuario lo autoriza. Que no tenga un papel más grande en la arquitectura parece una desventaja para OpenAI y, personalmente, me alegra

    • De acuerdo. Los rumores previos sonaban como si Apple y OpenAI casi fueran a fusionarse
      En la práctica, se sintió como una integración de relleno para poder decir que el iPhone tiene acceso a modelos de última generación. Personalmente, me parecen mucho más interesantes la integración profunda con el ecosistema y la indexación semántica
  • Todavía no conozco a nadie que quiera esto. No quiero IA en mi navegador web, ni en mi cliente de correo, ni en mi teléfono
    Cuando le pregunto a la gente a mi alrededor, todos parecen estar más o menos de acuerdo, así que no sé para quién es esto

    • Me ayudó a traducir canciones infantiles para mi hijo a otro idioma, manteniendo más o menos la rima y el significado
      Con GPT-3 no era muy bueno, pero 4o, o el modelo más reciente, hace ese trabajo realmente bien. Básicamente es fuerte en tareas de “trasladar el estilo de una cosa a otra”. Pero cuando le preguntaba datos que no encontraba en Google, siempre se equivocaba de forma ridícula
    • Sí quiero un asistente virtual que maneje solicitudes simples de manera confiable
      Pero hasta ahora las empresas todavía parecen estar buscando el rumbo, tirando todo contra la pared para ver qué se pega. Espero que, cuando esto se ordene en 2 o 3 años, podamos tener un gran asistente virtual
    • Muy de acuerdo. Todo lo que generé hasta ahora fue sumamente promedio
      Puede que haya algunos casos de uso legítimos, pero, como siempre, parece que todos se lanzan de más sin pensarlo lo suficiente
    • Yo sí lo quiero. Todo el día meto texto que escribí en modelos de lenguaje grandes para recibir ayuda de edición
      También, cuando empiezo una lluvia de ideas o una investigación, abro ChatGPT en modo voz y voy hablando, mientras al mismo tiempo abro el navegador para verificar los datos de lo que devuelve
    • Entonces ahora ya conoces a algunos. Me gustaría poder preguntarle al teléfono cosas como: “¿Cómo se llamaba la persona que me escribió por correo sobre la entrevista de la semana pasada?”
      Así no tengo que ponerme a revisar correos y perder el contexto que tengo en la cabeza
  • Esto se ve bien, pero en realidad podría ser una amenaza existencial para OpenAI
    Cuando tienes un único cliente enorme, ese cliente termina teniendo demasiado poder sobre el negocio. Apple algún día podría simplemente negarse a pagar, y tiene recursos para aguantar aunque una demanda dure años. La razón por la que Benjamin Moore no vende en Home Depot ni Lowe’s y mantiene sus propias tiendas también es que los grandes clientes pueden imponer condiciones. Apple incluso diseñó sus propios chips para acelerar el procesamiento de aprendizaje automático, y la alianza con OpenAI es claramente una solución temporal. Si tiene oportunidad, debilitará a OpenAI y, cuando pueda, la reemplazará. A Apple no le gusta depender de socios para funciones centrales; por eso abandonó Google Maps y se pasó a Apple Maps aunque todavía esté por detrás. Y si no reemplaza a Google Search es porque Google le paga una fortuna y Apple todavía no ha logrado sustituirlo. Para OpenAI parece una buena jugada, pero es como meter al zorro en el gallinero

    • ¿Tienes alguna cita o fuente para algo de lo que acabas de decir?
      Eso de que Apple no pague y aguante con demandas también lo podrían hacer OpenAI y Microsoft, y Microsoft estaría feliz si pudiera perjudicar a Apple. Tampoco hay antecedentes de que Apple se haya comportado así con proveedores que usa. Lo de Benjamin Moore también se explica porque Home Depot tiene su propia marca, Behr, y en cada color de Behr indica qué color de Benjamin Moore copió, llevándose ventas como sustituto. También me gustaría saber cómo defines que Apple Maps “todavía está por detrás”, cuántas veces al día usas Apple Maps y si existe algún benchmark que compare ambos servicios
    • OpenAI ya tenía un “único cliente enorme”: Microsoft
      Más bien, el acuerdo con Apple es la primera señal de que OpenAI no es, en la práctica, una subsidiaria de Microsoft
    • Apple está corriendo para integrar IA en sus plataformas de cómputo actuales lo más rápido posible
      OpenAI probablemente cree que una IA suficientemente inteligente, es decir AGI o ASI, resolverá problemas mucho más grandes o creará, en la práctica, una plataforma de cómputo completamente nueva. De hecho, incluso ChatGPT, que hoy es un modelo de lenguaje grande con muchas limitaciones, casi parece su propia plataforma de cómputo. Apple está acelerando la velocidad con la que la gente se acostumbra a interactuar con agentes sin apps ni dispositivos elegantes. Si la IA de verdad llega a ser lo suficientemente buena, no sé quién va a necesitar a Apple dentro de 10 o 15 años
  • “Al acceder a ChatGPT desde Siri y Writing Tools, la protección de privacidad está integrada: las solicitudes no se almacenan en OpenAI y la dirección IP del usuario se oculta. Los usuarios también pueden vincular una cuenta de ChatGPT; en ese caso, la configuración de datos se rige por la política de ChatGPT”
    Entonces, ¿significa que, por defecto, las solicitudes de ChatGPT de un usuario común de Apple no se usan para el entrenamiento de OpenAI, pero las de un cliente de pago de ChatGPT Plus sí podrían usarse? También me da curiosidad si vincular una cuenta de ChatGPT Plus implica que mis datos se usarán para entrenamiento. Se siente raro que el estándar de privacidad para los clientes de pago sea más bajo que el de los usuarios que llegan por la alianza. Claro, sé que se puede impedir el uso para entrenamiento con la función “Temporary Chat” o desactivando la memoria.

    • En la configuración de la cuenta se puede desactivar de forma permanente que OpenAI use los datos de chats para entrenamiento.
      “Para desactivar el entrenamiento del modelo, ve a Settings > Data Controls desde el ícono de perfil en la parte inferior izquierda de la página y desactiva ‘Improve the model for everyone’. Cuando esta opción está desactivada, las conversaciones nuevas no se usan para entrenar el modelo”