Apple revela una nueva arquitectura de IA construida en torno a modelos Gemini de Google
(macrumors.com)- Apple Intelligence se reorganiza con una nueva arquitectura basada en Apple Foundation Models, desarrollados conjuntamente por Apple y Google
- Los nuevos modelos se basan en tecnología de la familia Gemini y están ajustados tanto para ejecutarse en el dispositivo como en servidores de Private Cloud Compute
- Los modelos mejorados admiten comprensión y generación de imágenes, generación de imágenes realistas, edición avanzada de fotos y preguntas y respuestas visuales
- Algunos dispositivos recibirán modelos de alto rendimiento con generación de voz, mejor precisión de dictado y una comprensión del lenguaje natural más sólida, pero no se especifica cuáles serán
- Apple afirma que los datos del usuario solo se usan para ejecutar la solicitud inmediata y que ni Apple ni terceros pueden acceder a ellos, además de que expertos externos pueden verificar en cualquier momento sus garantías de privacidad
Reorganización de la arquitectura de Apple Intelligence
- Apple anunció una amplia reorganización de la plataforma Apple Intelligence y presentó una nueva arquitectura basada en modelos fundacionales desarrollados junto con Google usando tecnología de la familia Gemini
- El eje de la nueva arquitectura son los Apple Foundation Models, desarrollados conjuntamente con Google, y Apple señaló que estos modelos están ajustados tanto para el procesamiento en el dispositivo como para la ejecución en servidores de Private Cloud Compute
- Apple describió su colaboración con Google como una colaboración “profunda” y dijo que aportará una “enorme mejora” a Apple Intelligence
- Los nuevos modelos ofrecen capacidades actualizadas de comprensión y razonamiento, además de soporte multimodal que incluye comprensión y generación de imágenes
Capacidades de los nuevos modelos
- Los modelos mejorados admiten nuevos casos de uso, entre ellos generación de imágenes realistas, edición avanzada de fotos y preguntas y respuestas visuales
- Algunos dispositivos recibirán una versión de modelo de alto rendimiento con funciones adicionales
- La versión de alto rendimiento ofrece generación de voz, mejor precisión de dictado y una comprensión del lenguaje natural más sólida
- Apple no especificó qué dispositivos serán compatibles con el modelo de alto rendimiento
Orquestador del sistema
- En el centro de la arquitectura reorganizada se ubica un nuevo orquestador del sistema
- El orquestador del sistema coordina de forma segura las funciones de Apple Intelligence en toda la plataforma de Apple
- Apple afirmó que el orquestador puede personalizar las respuestas según la app activa y la tarea actual del usuario
- Esta estructura hace posible lo que Apple describió como una “verdadera inteligencia a nivel de todo el sistema”
Enfoque de privacidad
- Apple contrastó su enfoque con el de sus competidores al decir que estos están “corriendo por delante” sin tomar en cuenta a los usuarios
- Apple Intelligence depende del procesamiento en el dispositivo y de Private Cloud Compute
- Se mantiene la promesa de que los datos del usuario solo se usan para ejecutar la solicitud inmediata y de que ni Apple ni terceros pueden acceder a ellos
- Apple añadió que expertos externos pueden verificar estas garantías de privacidad “en cualquier momento”
1 comentarios
Opiniones en Hacker News
La forma en que se está poniendo al día con la IA se siente bastante a lo Apple: envuelve herramientas externas con una arquitectura de privacidad, las mete en el sistema operativo y luego convierte en producto la capa de orquestación
Resulta interesante si Private Cloud Compute y el enrutamiento en el dispositivo podrán hacer que las funciones de modelos de terceros se sientan como un sistema de primera parte sin filtrar el contexto del usuario
Si Apple maneja bien la frontera Google-Apple, podría ser un movimiento elegante; si no, se sentirá como un frontend de Apple Intelligence sobre Gemini con una bonita capa de privacidad por encima
Los chatbots de terceros actuales no pueden lograr esa integración y, aunque pudieran, sería difícil confiarle a otra empresa ese nivel de acceso
Serían mejores garantías de privacidad más fuertes, pero aun así va en una dirección razonable
Seguramente evaluaron varios factores, incluidos modelos pequeños, pero el costo también debió ser una gran preocupación, y Google se siente como el único proveedor que está soltando tanta inferencia de IA gratis
Este cambio volverá aún más borroso cuándo y cómo consumidores o empleados deben pagar los costos de los servicios de IA. Por ejemplo, en la presentación mostraron tareas de consumo, no de programación, pero ¿se le podría pedir a Siri que, tras seleccionar 5 archivos, escriba un script en Python o una app pequeña? ¿Las empresas simplemente desactivarán las funciones de IA de Siri, o podrán enrutarlo a su propio sistema de auditoría y a sus propios proveedores de IA?
Quisiera saber más sobre qué impulsa realmente Apple Intelligence. Me intriga si usan un modelo insignia de Gemini detrás de sus propios prompts, si es ajuste fino, o si preentrenaron su propio modelo basándose en Gemini
También me pregunto si hay una diferencia significativa entre un modelo basado en Gemini y los Apple Foundation Models. No está claro si esa diferencia cambia entre modelos en el dispositivo y modelos alojados, ni si algunos modelos corren en Private Cloud Compute de Apple y otros en infraestructura de Google
Después lo explicaron con bastante detalle en el “keynote tech-talk”: [0]
Según Apple, son 5 modelos. En el dispositivo están AFM Core, es decir, el modelo on-device estándar de nueva generación con arquitectura densa, y AFM Core Advanced, que usa arquitectura dispersa, es multimodal nativo y permite comprensión de imágenes y voz expresiva
En Private Cloud Compute están AFM Cloud, el modelo principal para servidor optimizado para latencia y costo; AFM Cloud Image, para generación y edición de imágenes; y AFM Cloud Pro, el modelo de nivel más alto para razonamiento complejo y tareas de agente
Cloud Pro tiene una calidad al nivel de los modelos de frontera de Gemini y corre en GPU NVIDIA en la nube de Google bajo las garantías de privacidad de PCC de Apple
Todo excepto Cloud Pro son modelos personalizados que corren sobre Apple Silicon y, según dicen, fueron “refinados” con Google Gemini. Sobre Cloud Pro, dicen que es “el modelo más potente con calidad comparable a los Gemini frontier models”, así que, leyendo entre líneas, parece una capa envolviendo Gemini
[0]: https://9to5mac.com/2026/06/…
https://machinelearning.apple.com/research/introducing-apple...
Si tienes una Mac, puedes probarlo tú mismo
https://apfel.franzai.com/
La versión más potente, que probablemente solo funcionaría en dispositivos con 12 GB de RAM, parece ser un modelo similar pero un poco más grande que todavía no se ha publicado
Google ya había anunciado antes que permitiría alquilar hardware en sus propios centros de datos para correr Gemini completo. Es un enfoque basado en NVIDIA para que las empresas puedan entrenar o acceder a sus datos sin enviarlos a centros de datos de Google. Private Compute también podría ser que Apple esté alquilando grandes cantidades de ese tipo de equipos
La promesa de “Apple necesita ver los datos para realizar esta función, pero no tiene manera de ver esos datos aunque quisiera” parece imposible
Tendrían que publicar iOS como código abierto, dejar que el usuario controle el dispositivo y aloje la inferencia por su cuenta para poder verificar que no hay tráfico de red. Si es tal como dicen, no debería haber desventajas incluso si el usuario lo aloja por sí mismo
En esencia, parece que sigue haciendo lo mismo que Google Assistant y Siri han hecho durante años.
No me queda claro qué ganamos adicionalmente aquí.
Del mismo modo, los cientos de miles de líneas de código escritas a mano de Google Translate fueron reemplazados por completo por grandes modelos de lenguaje que traducen mucho mejor.
Los asistentes de IA basados en grandes modelos de lenguaje usan una pila tecnológica completamente distinta de la programación lógica tipo “if-then-else” en la que se basaba Siri antes, y sus capacidades también son muy diferentes.
Es raro que Apple elija a Google como proveedor en vez de Anthropic u OpenAI y termine poniéndose en desventaja.
¿No hace eso más difícil diferenciarse del asistente de los teléfonos Android? Viéndolo de forma más cínica, si Google quisiera, ¿no podría darle a Apple una versión degradada de Gemini para mantenerse por delante?
Desde la perspectiva del consumidor, da igual qué plataforma de teléfono elijas: lo que está debajo termina siendo lo mismo, y aparte de no usar asistente en absoluto, no hay forma de evitarlo, lo cual no suena nada bien.
Google ha trabajado más que Anthropic u OpenAI en ejecutar grandes modelos de lenguaje en dispositivos edge.
La fuente también dice que la nueva arquitectura se centra en Apple Foundation Models desarrollados en conjunto con Google y ajustados para funcionar tanto en el dispositivo como en servidores a través de la infraestructura Private Cloud Compute de Apple.
Eso podría significar que Google y Apple entrenaron modelos personalizados para el hardware de Apple, probablemente modelos on-device.
Si Gemini se vuelve un detalle de implementación, Apple deja abierta la posibilidad de cambiar más adelante a Anthropic u OpenAI sin que el usuario final lo sepa o le importe. Así que creo que están construyendo poder de negociación para el futuro.
Y además, por el acuerdo que Apple hizo con OpenAI hace un año, seguramente sí quemaron un poco ese puente.
Fui suscriptor de pago de Claude durante años, pero últimamente uso más la app gratuita de Gemini en un Android Pixel 9. Me gusta mucho porque busca bien como parte de la respuesta.
El modelo se siente fresco y actualizado. Sigue siendo una incógnita si Apple podrá integrar también esa función de búsqueda.
Puede que me equivoque, pero esto parece un golpe bastante fuerte a las afirmaciones de Apple sobre privacidad.
Apple añadió que expertos externos pueden verificar estas garantías de privacidad “en cualquier momento”.
¿De verdad crees que Google no protege la privacidad de sus grandes clientes de pago?
He usado productos pagos de Google durante años sin problemas, y las garantías de privacidad siempre han sido claras.
Mucha gente está pasando por alto que Google está muy por delante en IA edge.
Lo vengo diciendo desde antes de la fiebre por GPT, y los teléfonos Pixel ya tenían desde hace tiempo subtítulos en tiempo real, o sea, transcripción de voz en el dispositivo.
Este movimiento recuerda al iPhone original que venía con Google Maps
Es una estructura en la que compiten con Google y aun así usan su infraestructura. ¿Por qué no eligieron a otro proveedor como OpenAI o Anthropic?
Tal vez OpenAI no permitió que sus modelos corrieran en servidores de Apple
Google hacía bien el trabajo web de backend, y Apple tomaba los datos en la nube de Google para crear una gran app local. Lo mismo pasaba con la app de YouTube
Después de ver el iPhone antes de su presentación pública, Google cambió el rumbo de Android, y Android, que originalmente era un hardware estilo BlackBerry, giró hacia su dirección actual, iniciando la “guerra termonuclear”. También es interesante que Steve Jobs mostrara el iPhone de esa manera. Según Jobs, algo parecido le pasó con Bill Gates, y eso llevó al desarrollo de Windows
Ahora, 19 años después, quizá sea momento de volver a un enfoque pragmático. Si Apple no logra ofrecer bien este tipo de integración de IA dentro del sistema operativo, corre el riesgo de perder usuarios frente a Android. Si de todos modos hay que pagar por el modelo, tiene sentido elegir lo que crean que es mejor para el usuario. Parece beneficioso para Apple, porque puede retener a los usuarios actuales de iPhone y también atraer a usuarios de Android que quieren las mismas funciones pero con mejor privacidad
A estas alturas, pagarle a OpenAI en vez de a Google sería casi actuar por rencor. Puede haber razones para eso, pero como todo el liderazgo cambió en los últimos 20 años, sería como seguir peleando una guerra antigua. Aun así, antes de mostrarle a Google algo que todavía no has anunciado, conviene pensarlo dos veces
Apple ya tiene a todos metidos en su bolsillo a través de su ecosistema, así que solo necesita no arruinarlo. Aquí se prioriza más la estabilidad que el factor competitivo
Cada división de Google opera como si fuera una empresa Fortune 500 por sí sola, y tiende a actuar según sus propios intereses
Google probablemente ofreció las mejores condiciones. Si eres el jugador en tercer lugar, terminas sacrificando margen para aumentar volumen
Ojalá la UE obligara a Apple a permitir que el usuario final elija modelos externos
Sería genial que un modelo local centrado en la privacidad pudiera llamar, mediante un protocolo abierto bien definido, al modelo que uno quiera, como Claude, Grok o DeepSeek
Esto suena a una verdadera arquitectura de sistema operativo. Que se dejen de modelos de negocio basados en rebates
¿Obligar a Apple a dar soporte a toda clase de modelos arbitrarios? Es una idea ridículamente mala