1 puntos por GN⁺ 2024-06-11 | 1 comentarios | Compartir por WhatsApp
  • Apple presentó Apple Intelligence, que combina modelos generativos con el contexto personal para llevar la generación de lenguaje e imágenes y la ejecución de tareas entre apps a la experiencia básica de iPhone, iPad y Mac
  • iOS 18, iPadOS 18 y macOS Sequoia integran Writing Tools, prioridad y resúmenes en Mail, resúmenes de notificaciones, y funciones de grabación, transcripción y resumen de audio en Notes y Phone
  • El área de imágenes se amplía con Image Playground, Genmoji y las funciones de búsqueda, Clean Up y Memories de Photos, disponibles en apps de Apple y en apps de terceros que adopten la API
  • Siri se expande para encargarse de entrada de texto, reconocimiento de pantalla, cientos de acciones dentro y fuera de apps, respuestas sobre cómo usar el dispositivo y solicitudes basadas en información en el dispositivo
  • La privacidad se centra en el procesamiento en el dispositivo y Private Cloud Compute; ChatGPT se integra con Siri y Writing Tools con GPT-4o tras la autorización del usuario, y la beta estará disponible este otoño en inglés de EE. UU.

Estructura básica de Apple Intelligence

  • Apple Intelligence es un sistema de inteligencia personal para iPhone, iPad y Mac que combina las capacidades de los modelos generativos con el contexto personal del usuario
  • Se integra profundamente en iOS 18, iPadOS 18 y macOS Sequoia, y usa Apple silicon para realizar las siguientes tareas
    • Entender y generar lenguaje e imágenes
    • Ejecutar acciones entre apps
    • Simplificar y acelerar tareas cotidianas a partir del contexto personal
  • Para solicitudes más complejas, Private Cloud Compute ajusta la capacidad de cómputo necesaria entre el procesamiento en el dispositivo y modelos basados en servidores con Apple silicon

Comprensión del lenguaje y herramientas de escritura

  • Writing Tools, integrado en todo el sistema, se aplica en iOS 18, iPadOS 18 y macOS Sequoia a casi cualquier lugar donde se escriba, como Mail, Notes, Pages y apps de terceros
  • Las funciones de asistencia de escritura se enfocan en refinar borradores según el propósito y el formato del texto
    • Rewrite: sugiere varias versiones del texto escrito y ajusta el tono según la audiencia y la tarea
    • Proofread: revisa gramática, elección de palabras y estructura de oraciones, y ofrece sugerencias de corrección con explicaciones
    • Summarize: resume el texto seleccionado en forma de párrafo, viñetas clave, tabla o lista
  • Mail agrega Priority Messages, que muestra correos urgentes en la parte superior de la bandeja de entrada
    • Permite ver un resumen sin abrir el correo
    • En hilos largos, se pueden ver los detalles relevantes con un solo toque
    • Smart Reply sugiere respuestas rápidas e identifica las preguntas del correo para ayudar a responderlas todas
  • Las notificaciones incorporan Priority Notifications y funciones de resumen para reducir la información que hay que evaluar en la pantalla bloqueada
    • Muestra las notificaciones importantes en la parte superior de la pila
    • Muestra en la pantalla bloqueada el contenido esencial de notificaciones largas o acumuladas
    • El nuevo Focus Reduce Interruptions muestra solo las notificaciones que podrían requerir atención inmediata
  • En las apps Notes y Phone se puede grabar, transcribir y resumir audio
    • Al iniciar una grabación durante una llamada, se notifica automáticamente a los participantes
    • Cuando termina la llamada, Apple Intelligence resume los puntos clave

Generación de imágenes y funciones de expresión

  • Image Playground permite a los usuarios crear imágenes en segundos y ofrece tres estilos: Animation, Illustration y Sketch
  • Se puede usar directamente dentro de apps como Messages y también se ofrece como app independiente
    • Todas las imágenes se generan en el dispositivo
    • Se pueden elegir conceptos de categorías como temas, vestimenta, accesorios y lugares
    • Se puede ingresar una descripción para definir la imagen
    • Se pueden incluir personas de la fototeca personal en la imagen
  • En Messages, muestra conceptos personalizados recomendados relacionados con la conversación
    • Por ejemplo, en una conversación grupal donde se planea una caminata, se recomiendan conceptos relacionados con amigos, destino y actividad
  • En Notes se puede usar Image Playground con Image Wand desde la paleta de herramientas de Apple Pencil
    • Puede convertir un boceto aproximado en una imagen
    • Al seleccionar un espacio vacío, puede generar una imagen usando el contexto alrededor
  • Image Playground también está disponible en Keynote, Freeform y Pages, y se puede usar en apps de terceros que adopten la nueva Image Playground API

Genmoji y funciones de Photos

  • Genmoji es una función que crea imágenes con forma de nuevos emojis a partir de una descripción
    • Al ingresar una descripción, se muestran el Genmoji y opciones adicionales
    • Se pueden crear Genmoji de amigos o familiares a partir de fotos
    • Se pueden agregar en línea dentro de un mensaje o compartir como stickers y reacciones Tapback
  • La búsqueda de Photos admite lenguaje natural para encontrar escenas específicas de forma más directa
    • Permite buscar fotos concretas como “Maya skateboarding in a tie-dye shirt”
    • La búsqueda en videos puede encontrar un momento específico dentro de un clip y saltar directamente al segmento relevante
  • La nueva herramienta Clean Up identifica y elimina elementos distractores del fondo de una foto
    • Está diseñada para no modificar por accidente al sujeto
  • En Memories, cuando el usuario ingresa una descripción, Apple Intelligence elige fotos y videos, arma una línea narrativa con capítulos basados en temas y la organiza como una película
    • También ofrece sugerencias de canciones de Apple Music adecuadas para ese recuerdo
    • Las fotos y videos del usuario se mantienen privados en el dispositivo y no se comparten con Apple ni con otras personas

Cambios en Siri

  • Siri se integra más profundamente en la experiencia del sistema gracias a Apple Intelligence
  • Su capacidad de comprensión del lenguaje se fortalece para seguir al usuario incluso si se traba al hablar y para mantener el contexto entre solicitudes
  • Los usuarios pueden escribirle a Siri y alternar entre texto y voz según la situación
  • Cuando Siri se activa, aparece un nuevo diseño con un efecto de luz que rodea los bordes de la pantalla
  • También puede responder miles de preguntas sobre cómo usar iPhone, iPad y Mac
    • Programar un correo en la app Mail
    • Gestiona preguntas como cómo cambiar de Light Mode a Dark Mode
  • Mediante reconocimiento de pantalla, puede realizar acciones conectadas con la información que aparece en la pantalla actual
    • Puede agregar a una tarjeta de contacto una nueva dirección recibida en Messages
  • Realiza cientos de acciones nuevas dentro y fuera de apps de Apple y de terceros
    • Abrir un artículo específico de Reading List
    • Gestiona solicitudes como enviar las fotos de la parrillada del sábado a una persona específica
  • También procesa solicitudes personalizadas basadas en información en el dispositivo del usuario
    • Encuentra y reproduce un podcast recomendado aunque el usuario no recuerde si lo vio en un mensaje de texto o en un correo
    • Busca información de un vuelo y la compara con el seguimiento de vuelos en tiempo real para informar la hora de llegada

Privacidad y Private Cloud Compute

  • Apple Intelligence se basa en una arquitectura pensada para entender el contexto personal y, al mismo tiempo, proteger la privacidad del usuario
  • Muchos modelos se ejecutan por completo en el dispositivo
  • Para solicitudes complejas que requieren más capacidad de procesamiento, se usa Private Cloud Compute
    • Ejecuta modelos de servidor más grandes en servidores basados en Apple silicon
    • Está diseñado para que los datos no se almacenen ni queden expuestos
  • Expertos independientes pueden inspeccionar el código que se ejecuta en servidores Apple silicon para verificar la protección de la privacidad
  • Private Cloud Compute garantiza criptográficamente que iPhone, iPad y Mac solo se comuniquen con servidores que ejecutan software registrado públicamente y verificable

Integración de ChatGPT

  • Apple integra el acceso a ChatGPT dentro de la experiencia de iOS 18, iPadOS 18 y macOS Sequoia
  • Los usuarios pueden usar la experiencia especializada de ChatGPT, así como sus capacidades de comprensión de imágenes y documentos, sin pasar a una herramienta separada
  • Siri puede usar ChatGPT cuando sea útil
    • Pide permiso al usuario antes de enviar preguntas, documentos o fotos a ChatGPT
    • Tras la autorización, Siri muestra la respuesta directamente
  • ChatGPT también está disponible en Writing Tools en todo el sistema
    • A través de Compose, puede generar el contenido que se está escribiendo
    • Con las herramientas de imagen de ChatGPT, puede generar imágenes en diversos estilos para complementar el texto
  • El uso de ChatGPT incluye protecciones de privacidad
    • Las direcciones IP se ocultan
    • OpenAI no guarda las solicitudes
    • Si el usuario conecta su cuenta, se aplican las políticas de uso de datos de ChatGPT
  • La integración de ChatGPT llegará a iOS 18, iPadOS 18 y macOS Sequoia a fines de este año y está basada en GPT-4o
    • Se podrá acceder gratis sin crear una cuenta
    • Los suscriptores de ChatGPT podrán conectar su cuenta para usar funciones pagas

Calendario de disponibilidad y dispositivos compatibles

  • Apple Intelligence se ofrece gratis a los usuarios
  • Estará disponible este otoño como beta en iOS 18, iPadOS 18 y macOS Sequoia, inicialmente en inglés de EE. UU.
  • Algunas funciones, plataformas de software e idiomas adicionales se ofrecerán durante el año siguiente
  • Los dispositivos compatibles son los siguientes
    • iPhone 15 Pro
    • iPhone 15 Pro Max
    • iPad y Mac con chip M1 o posterior
  • Para usarlo, Siri y el idioma del dispositivo deben estar configurados en inglés de EE. UU.
  • Hay más información disponible en apple.com/apple-intelligence

1 comentarios

 
GN⁺ 2024-06-11
Opiniones en Hacker News
  • Las funciones de IA personal que Apple mostró hoy fueron realmente impresionantes.
    Demuestran que el verdadero poder de la IA para consumidores está en manos de los dueños de las plataformas que ya controlan la mayor parte de nuestra vida digital —mensajes, correo, fotos, apps—, es decir, Apple o Google, y Microsoft en el ámbito laboral/personal.
    La forma en que Siri usa el contexto de correos y mensajes para encargarse de tareas como calendario, reservas y confirmaciones de vuelos parece realmente útil. Siempre pensé que algún día llegarían funciones de inteligencia personal, pero no esperaba que Apple saliera tan fuerte; el efecto de haber atraído a la gente a su ecosistema es enorme.
    También me gustó que hayan considerado la nube privada, la integración con ChatGPT, el playground de generación de imágenes y Genmoji; parece que podría convertirse en una función “para todos nosotros”, como dijo Craig. Eso sí, la generación de imágenes de personas reales está demasiado cerca del valle inquietante, y no creo que me alegrara recibir una imagen de cumpleaños tan fría y con tan poco esfuerzo.

    • Esta es una ventaja de la forma en que Apple maneja la propiedad del producto, en contraste con Google o Microsoft.
      Creo que la convergencia de la IA va a exponer las fallas organizacionales de forma mucho más evidente que cambios tecnológicos anteriores. Nadie quiere una IA generativa que solo funcione en Gmail y otra distinta que solo funcione en Messages; la gente quiere una función de plataforma que opere en todos los lugares donde escribe texto.
      No tengo claro si Google o Microsoft, como organizaciones, pueden ofrecer algo así hoy.
    • Todavía es demasiado pronto para juzgar, y no deberíamos dejarnos llevar tan fácilmente por el marketing.
    • Creo que Apple Intelligence va a ser un gran éxito. iOS es claramente una plataforma adecuada para combinar una buena experiencia de usuario con IA, y al conectar modelos de lenguaje grandes con Siri, el equipo de Siri obtiene la oportunidad de redimirse rápidamente de sus pecados del pasado.
      La computación privada también parece muy importante. Además del uso obvio de procesar cargas pesadas en servidores en la nube, podría abrir el camino a un intérprete de código personal, es decir, scripting real en iOS y, a largo plazo, permitir desarrollo en iPadOS.
      También es importante que Apple use sus propios chips en servidores. La pregunta correcta no es si “alcanza”, sino qué harán para llevar el lado de desarrolladores y el de hardware a un nivel NVIDIA.
      Parece que la gente todavía no entiende el panorama completo porque solo piensa que Apple tiene que entrar en la carrera de modelos de vanguardia. Ahora entiendo el titular de que a Nadella le preocupaba la alianza entre Apple y OpenAI.
    • Gran parte de lo que mostraron fue impresionante, y parece materializar de verdad la promesa del asistente digital personal que los dispositivos de computación personal han promocionado durante décadas.
      La pregunta más importante es la confiabilidad. Lo clave es si funciona correctamente cada vez, o si existe la posibilidad de que malinterprete gravemente el contenido y deje en una situación incómoda al usuario que confió en él.
    • En el contexto del procesamiento fuera del dispositivo, también hay que tener presente que el alcance y la influencia de las leyes de vigilancia de Estados Unidos se han ampliado recientemente.
      https://www.theguardian.com/us-news/2024/apr/16/house-fisa-g...
  • Salvo por la búsqueda y las mejoras de Siri, no tengo claro qué tan útiles serán las funciones generativas que Apple propone aquí.
    Si uno pasa una hora dibujando algo para el cumpleaños de alguien y se lo manda, una gran parte del valor que percibe quien lo recibe no está en la calidad del dibujo, sino en que uno dedicó ese esfuerzo y ese tiempo para crear un resultado único solo para esa persona. Es parecido a la diferencia de satisfacción entre usar algo hecho por uno mismo y algo comprado.
    La imagen de IA que Tania creó en unos segundos puede ser divertida al principio, pero rápidamente se convertirá en spam que llena la conversación y no aportará nada. Lo mismo pasa con crearle a un niño un cuento para dormir en el que él sea el protagonista.
    En un mundo donde puedes tener cualquier cosa, el valor de todo se vuelve cero.

    • Con mi hijo hemos ido creando un universo narrativo bastante elaborado y detallado, que siempre empieza de la misma manera y tiene personajes ya conocidos.
      Ayer, mientras manejaba para comprar burritos, le dicté a gpt-4o un resumen detallado, incluida toda la introducción de la historia, y le pedí que me contara una nueva aventura usando ese contexto. Lo hizo increíblemente bien. Pude ver la reacción de mi hijo en el espejo, y no dañó lo que ya habíamos construido. Al contrario, me dio ideas nuevas para usar cuando yo cuente historias.
      Si uno se apoya en la IA generativa sin hacer ningún aporte personal o creativo propio, probablemente no salgan resultados interesantes; pero si la pones encima de algo que has seguido creando y construyendo, puede dar resultados excelentes.
      En ese sentido, la IA generativa me parece otra herramienta que se aprende a usar mejor con práctica, como si después de usar solo piano u órgano también obtuvieras un sintetizador.
    • Lo mismo podría decirse de enviar un mensaje de feliz cumpleaños frente a enviar una carta o tarjeta escrita a mano.
      Hoy nada impide mandar una tarjeta escrita a mano, y claro que se agradece más, pero la gente también agradece los mensajes. Puede ser especialmente cierto cuando están lejos o cuando la relación no es tan profunda.
    • El valor de un regalo no depende solo del esfuerzo o el dinero invertidos. Si elegiste algo bueno, también hay valor en elegir bien.
      Mientras más fácil se vuelva regalar, más importante será el contexto.
    • Creo que la misma lógica aplica cuando compras una tarjeta en Hallmark.
    • Como alguien que ha recibido montones de imágenes de “buenos días” de parte de seres queridos todos los días, entiendo perfectamente ese sentimiento.
      Será interesante ver si el spam de IA, especialmente emojis y stickers personalizados, se reutiliza o se esparce como plástico de un solo uso.
  • La demo se sintió como la imagen de la IA que imaginábamos antes de que apareciera ChatGPT. Era una forma de interacción personalizada, que entendía el contexto y estaba profundamente integrada en todo el sistema.
    También me gustó la explicación de cómo intentan mantener las solicitudes lo más privadas posible incluso al procesar tareas de IA que requieren servidores. Si se trata de software de servidor que corre en hardware de Apple y es auditable, parece casi lo mejor posible para ese tipo de trabajos; si fuera open source, mejor todavía.
    La demo en la que Siri entendía el contexto de “mamá” a partir del contenido de un email que ella había enviado fue exactamente esa escena que imaginábamos en el mundo de la IA. Es muy probable que la capacidad puramente de IA del modelo en sí termine commoditizándose algún día, y creo que ahora lo importante es la integración de hardware y de todo el sistema que aprovecha ese modelo.
    La experiencia después del lanzamiento real es otra cosa, pero solo la visión ya fue impresionante, y Apple una vez más entiende la experiencia de usuario. Las implicaciones de este anuncio pueden ser mucho más grandes de lo que parecen, y en especial entusiasma la posibilidad de hacer que la computación sea más fácil para las personas mayores.

    • Hasta que estas funciones lleguen a manos de los reviewers, no sabremos qué tan buenas son.
      Es fácil hacer una demo vistosa de una IA que “puede hacer de todo”, pero si en la realidad se rompe con frecuencia, al final se convierte en la Siri actual. Hay que recordar este anuncio de hace 12 años: https://www.youtube.com/watch?v=sw1iwC7Zh24
      De muchas de las cosas que prometía entonces, todavía hay varias que cuesta confiarle a Siri.
    • Parece que demasiada gente asumió que, como ChatGPT es una interfaz conversacional, la IA también debe diseñarse así. Eso es parecido a pensar que las computadoras siempre serían de línea de comandos.
      Apple ofreció bastante bien interfaces gráficas orientadas a cada propósito para las funciones de IA, y será interesante ver cómo se profundiza eso en adelante.
    • Sinceramente, funciones como que Siri entienda lo que dice mamá en un email me parecen todas demasiado inquietantes.
    • Si esta función opera como en la demostración, va a atraer a la gente más profundamente al ecosistema.
      Uno va a querer que entienda su vida, y como todos los dispositivos tienen que poder construir mi contexto para responder eventos o distintas preguntas, eso puede llevar a pensar cosas como: “¿tengo que comprar un Apple TV en vez de un Chromecast para que Siri también sepa qué programa estoy viendo?”.
    • Al final, siento que esto va a agrandar aún más el foso defensivo y hará más doloroso el lock-in de la plataforma, y eso no me gusta.
      El precio del iPhone sigue subiendo, y una vez que estés metido profundamente en este ecosistema, el cómputo de alto rendimiento puede sentirse prácticamente como una extorsión. Porque irse del mundo Apple se volvería casi imposible.
      Los competidores tampoco tienen sistemas tan integrados, así que les será difícil integrar todo al mismo nivel.
  • Desde el punto de vista del branding, es perfecto. Algo que “parece pequeño”, como las letras del nombre de la empresa, puede tener un gran impacto décadas después.
    Pueden apropiarse de AI == Apple Intelligence, y el “AI for the rest of us” del final capturó muy bien este momento y parece insinuar hacia dónde irá Apple.
    Creo que Apple va a acumular experiencia manejando una escala enorme de usuarios más casuales que usan esto para imágenes creativas o graciosas, emojis, tareas de texto y mejoras de calidad de vida. Aunque no esté en la frontera de las nuevas tecnologías de IA para integrarlas de inmediato en funciones para usuarios, para soportar esta escala única tendrá que acercarse a la frontera de esas mismas tecnologías.
    Esta WWDC fue impresionante, y me dio curiosidad que no hubiera novedades sobre Mac Studio, Mac Pro, M3 Ultra, M4 Ultra o M3/M4 Extreme. Imaginaba que usarían sus propios M2 Ultra y similares para capacidad de cómputo en la nube, y fue interesante que efectivamente lo mencionaran; me pregunto si saldrán más detalles sobre este tema.

    • Creo que el anuncio más grande fue la nube de cómputo privada basada en Apple Silicon. Apple está desarrollando internamente la experiencia necesaria para apuntarle a NVIDIA.
    • Lo que hizo Apple aquí es inteligente, pero también podría generar confusión.
      Por un lado parece decir “nosotros somos dueños de esto”, pero por otro está montando encima una marca que está fuera de su control. Espero que la gente no empiece a abreviarlo como ApI. Si no, contaminará los resultados de búsqueda de API.
    • Se siente como si nos hubieran dado migajas para un futuro anuncio de hardware. Por ejemplo, podrían salir con algo como: “Nos complace anunciar el potente procesador de última generación que ya venimos usando en nuestra nube privada de IA, el M4 Ultra”.
    • Hacer que ni siquiera se puedan usar las iniciales del producto y que tampoco se pueda buscar bien es una jugada realmente astuta. Apple lo hizo de nuevo.
  • Soy escéptico hasta verlo funcionando de verdad.
    Por un lado, Apple tiene un buen historial en privacidad y procesamiento en el dispositivo, pero este anuncio tuvo demasiadas partes ambiguas. No queda claro con qué criterio se ejecuta algo en la nube, cómo se usa el modelo personal entre varios dispositivos, si eso significa que se mueve temporalmente a la nube, o qué cambia en modo invitado.
    Incluso la frase “OpenAI no guarda las solicitudes” se siente deliberadamente opaca. Esperaba un enfoque como aprendizaje federado, usando varios dispositivos Apple juntos para procesar solicitudes, pero parece que al final ganó la navaja de Occam, así que habrá que ver.

    • Apple también tiene un largo antecedente de decir “lo estás agarrando mal”. No espero un asistente de IA increíble, sino algo que de vez en cuando acierte la intención del usuario.
    • Para ser justos, esto fue una keynote, y los detalles se revelarán en las sesiones.
    • Repitieron tantas veces lo de que tienen “buen historial de privacidad” que terminaron convirtiéndolo en un hecho.
    • Parece que todavía tienen mucho trabajo por delante en los próximos meses, y algunas funciones podrían retrasarse.
      En la beta veremos cómo se implementa realmente lo que dijo Apple, pero yo me mantendré lejos de la beta. Aunque da un poco de pena, por ahora la ambigüedad juega a favor de Apple. Es mejor prometer menos y entregar más que prometer de más y entregar de menos.
    • Deberían ofrecer un mecanismo para que el usuario pueda ver qué datos se suben.
  • Si entendí bien, hay tres cosas: 1) IA en el dispositivo, 2) IA que usa servidores de Apple, 3) IA que usa servicios de ChatGPT/OpenAI u otros servicios futuros
    La 1 parece pasar a la 2 si determina que necesita capacidad adicional de procesamiento, y la 3 solo se invoca con permiso explícito del usuario
    Como se señaló más abajo, también se agregarán otros proveedores más adelante

    • No veo una diferencia real entre la 2 y la 3. En cuanto los datos salen del dispositivo, ya salieron, y no se pueden recuperar ni controlar
    • Parece que la etapa 3 también planea admitir otros modelos y proveedores más adelante
      Sería bueno que admitiera cualquier servidor con una API estándar sencilla, para poder correr un Llama 3 autoalojado o lo que aparezca en los próximos 6 a 12 meses
    • La 3 me sonó pensada para usos no personales. Básicamente es una función estilo motor de búsqueda
      Parece algo para usar cuando quieres buscar marcas o información deportiva, películas y datos sobre ellas, cosas así
    • El problema es que Apple no especificó cuándo la 1 puede pasar a la 2, ni si eso se puede desactivar de forma totalmente clara
      Hasta donde sé, la 1 también podría pasar a la 2 cuando el gobierno exija datos personales o cuando el modelo publicitario de Apple necesite detalles sensibles para personalización
    • Yo también lo entendí así. Me habría gustado que aclararan mejor dónde está la frontera entre la 1 y la 2, pero cuando esté en manos de la gente, seguro que los YouTubers lo investigarán a fondo pronto
  • Como dije en otro hilo, me molesta bastante que hayan incluido generación de imágenes y que recibiera tanta atención
    Me preocupa la confiabilidad si uno empieza a creer información importante sin verificar la fuente; por ejemplo, en casos como vuelos, podría terminar mal
    Aun así, el nivel de acabado de las funciones y su utilidad real son interesantes. Tal vez no sean las más llamativas, pero lo que mostraron sí parece útil. También me gusta que ChatGPT sea opcional cada vez que Siri considere que puede ser útil
    La gran pregunta es si se pueden apagar los componentes en línea y qué ocurre cuando algo no se puede procesar localmente. Con la explicación de que los servidores usan el mismo chip, también me pregunto si el modelo no puede correr localmente, o si el motivo es el contexto
    Tampoco queda claro si aplica a funciones completas o a solicitudes puntuales, y podría significar que con el tiempo el nivel de procesamiento local y en la nube variará según el hardware

    • En cuanto a la generación de imágenes, Image Playground parece admitir tres estilos: Animation, Illustration y Sketch
      Se nota una ausencia. No hay estilo fotorrealista
      Me parece una buena elección. No me encanta convertir todo en más memes y emojis caricaturizados, pero al menos es claramente inventado y apunta más a lo “divertido”. A los niños les gustará, y a los adultos también puede gustarles
      Aun así, habrá polémica porque la gente podrá crear cosas muy inapropiadas, pero el nivel de riesgo baja
    • Parece que también muestra el contexto de dónde salió la información: mensajes, eventos y otros materiales
      Así se puede comprobar rápidamente si la respuesta es correcta. Es más cercano a una búsqueda semántica, pero explicando los resultados con texto más flexible
    • Creo que es muy probable que con el tiempo el nivel de procesamiento local y en la nube varíe según el dispositivo
      Apple agregó servidores como solución temporal por necesidad, pero el estado ideal sería llegar a un punto en que todos los dispositivos que vende puedan ejecutar todo localmente durante un buen período y entonces apagar los servidores
    • Me preocupa la capacidad infinita que tendrán los adolescentes durante los próximos dos años para eludir las barreras de seguridad y generar imágenes que probablemente sean inapropiadas para la escuela, mientras Apple encuentra cómo controlarlo
    • Apple escondió esta salida: primero estará disponible en inglés de Estados Unidos y luego llegará a otras regiones a lo largo de un año
      Puede que eso nunca llegue. Los modelos de lenguaje grandes fallan rápido a medida que uno se aleja de los idiomas con abundantes recursos
  • Esto se ve realmente genial
    Dijeron que el modelo puede escalar a private cloud compute basado en Apple Silicon, y que el dispositivo del usuario verifica la ejecución de “publicly verifiable software” para evitar el uso indebido de datos
    Me pregunto si el código del lado del servidor será open source. Si lo es, sería una sorpresa positiva. Tengo curiosidad por ver cómo evoluciona
    Si funciona como lo publicitaron, sería un “cállate y toma mi dinero” inmediato. Siri por fin parece estar convirtiéndose en lo que siempre debió ser, y también me pregunto si, al montarlo sobre el catálogo de Shortcuts Actions, están ampliando desde el inicio el rango de tareas posibles
    Las funciones de generación de imágenes y emojis integradas con Apple Photos y otras partes del sistema también se ven muy buenas. Parece que para Mac/iPad se requiere M1 o superior, y para iPhone, un 15 Pro

    • No hace falta comprar un dispositivo nuevo necesariamente. Es compatible hacia atrás con A17 Pro y M1, M2, M3, M4
      La integración de servicios usa los modelos existentes, y se siente como una extensión de la API que viene desde AppleScript hacia modelos de lenguaje grandes o sistemas tipo Stable Diffusion. Aunque, por el impulso de juegos y nube, parece que quieren empujar el M4 lo antes posible
    • Para quienes tengan curiosidad, sí hay integración con ChatGPT
      Si el modelo en el dispositivo decide que “esto lo puede responder mejor ChatGPT”, le pregunta al usuario si quiere usarlo. Por la descripción, parecía una estructura en la que con el tiempo se podrán conectar otros modelos
      En particular, ChatGPT 4o se puede usar gratis sin crear una cuenta de OpenAI
    • Esta parte me da mucha curiosidad. Lo presentaron como “ejecutar modelos de lenguaje grandes en la nube”, pero a mí me parece más bien que enterraron lo esencial
      ¿Significa que, en general, un cliente puede verificar criptográficamente el código que se está ejecutando en un servidor? Si es así, sería extremadamente interesante y útil incluso fuera de este caso de uso
    • Viendo que la integración con ChatGPT parece una llamada de API, esto se siente como una capa de orquestación que corre sobre Apple Silicon
      No queda claro qué se calcula exactamente en “private cloud compute”
  • La parte en la que pregunta “¿Puedo usar ChatGPT para esta tarea?” se siente muy torpe y poco propia de Apple
    Es una expresión vieja, pero parece algo que haría que Steve Jobs se revolcara en su tumba. Sinceramente, me confunde por qué es necesario
    ¿No lograron crear una integración lo suficientemente consistente? Si es así, ¿significa que el resto no está basado en ChatGPT? ¿Cuál es la diferencia? Desde la perspectiva del usuario, es bastante confuso

    • Creo que fue la decisión más inteligente y realista de toda la presentación
      Ser el mejor en IA dentro del dispositivo es una oportunidad de mercado enorme. Intentar hacerlo todo por cuenta propia sería tan tonto como lanzar Safari sin una alianza con la página principal de búsqueda de Google
      Apple puede enfocarse en sus fortalezas: el procesamiento en el dispositivo y la integración de la IA en la experiencia de usuario a lo largo de toda la plataforma, sin comprometer la privacidad. Y en áreas donde hay que enviar datos para acceder a granjas de servidores externas a gran escala e Internet, como las consultas de búsqueda con IA, puede aprovechar al líder del mercado
    • Desde la perspectiva del usuario, es 100% claro
      Si el sistema no dice que “llamará a un amigo para obtener la respuesta”, significa que es 100% local o, en el peor de los casos, se mantiene dentro de Apple Intelligence, auditado de forma completamente privada
      Si preguntas por una receta de pan de plátano, está bien que vaya a ChatGPT, pero quizá no quieras enviar información más personal
    • Es una frontera clara entre “mis datos están en mi dispositivo o dentro del ecosistema de Apple” y “mis datos salen de Apple y van a un tercero”
    • El punto central de todo lo que anunció Apple es la privacidad. La idea es que la mayoría de las preguntas se responden de forma local o mediante el sistema Private Compute
      Más específicamente, la respuesta a “¿OpenAI ve mis datos personales o mis preguntas?” es: “Todo se procesa en el iPhone o en Private Compute, a menos que autorices conversar con OpenAI”
    • Apple está enfatizando el enfoque de privacidad en las tareas de IA, y en el momento en que algo sale hacia ChatGPT, ese flujo se rompe
      De hecho, si ese aviso de confirmación no interrumpiera el flujo y no dejara claro cuándo se están trayendo resultados de ChatGPT, habría dudado en usar las nuevas funciones de IA
  • Esto se ve realmente genial
    Dijeron que el modelo puede escalar a private cloud compute basado en Apple Silicon, y que el dispositivo del usuario verifica que se esté ejecutando “publicly verifiable software” para evitar el uso indebido de los datos
    Me pregunto si el código del lado del servidor será de código abierto. Si es así, sería una sorpresa positiva. Tengo curiosidad por ver cómo evoluciona esto
    Si funciona como lo están promocionando, sería un caso inmediato de “cállate y toma mi dinero”. Siri por fin parece convertirse en lo que siempre debió ser, y también me pregunto si, al montarlo sobre el catálogo de Shortcuts Actions, están ampliando desde el inicio el rango de tareas posibles
    Las funciones de generación de imágenes y emojis integradas en Apple Photos y otras partes del sistema también se ven realmente geniales. Parece que Mac/iPad requieren M1 o superior, y iPhone requiere el 15 Pro

    • Dijeron que el código del lado del servidor no será de código abierto, pero que estará disponible para que expertos independientes lo auditen
    • Apple dijo claramente que para iPhone se necesita 15 Pro o superior, y para los demás dispositivos, M1 o superior