- Apple presentó nuevos modelos de IA visión-lenguaje (AFM, Apple Foundation Models) y el framework Foundation Models para desarrolladores (API), además de mejorar de forma importante el rendimiento y la eficiencia tanto de los modelos on-device como de los de nube
- El modelo AFM on-device está compuesto por un transformador de 3B parámetros y un transformador visual de 300 millones de parámetros, con soporte para entradas de texto e imagen, además de funciones multilingües y de visión; el modelo de servidor usa una arquitectura MoE personalizada
- Ofrece funciones potentes y acceso para desarrolladores, como compactación del modelo (cuantización y LoRA), soporte para 15 idiomas, comprensión de imágenes y uso de herramientas
- El modelo on-device mostró ventajas frente a modelos rivales en comprensión de imágenes e inglés no estadounidense, pero el modelo de servidor queda por debajo de modelos recientes como GPT-4o
- Está atrayendo atención el cambio en la estrategia de IA de Apple y su influencia dentro del ecosistema iOS, en medio de la reciente polémica por un paper de Apple y el retraso en la actualización de Siri con IA
Actualización importante de Apple Foundation Models (AFM)
- Apple actualizó tanto sus modelos de IA on-device (integrados en móviles) como los alojados en servidor (AFM), con grandes mejoras en velocidad, eficiencia y rendimiento
- También lanzó una nueva API para desarrolladores (Foundation Models framework), que permite invocar IA on-device en dispositivos con Apple Intelligence habilitado
Arquitectura y funciones clave
- Entrada/salida: texto, imagen (hasta 65,000 tokens de entrada); la salida es texto
- Arquitectura:
- AFM-on-Device: transformador de 3 mil millones de parámetros, transformador visual de 300 millones de parámetros
- AFM-Server: transformador personalizado Mixture-of-Experts (MoE) (número de parámetros no revelado), transformador visual de 1 mil millones de parámetros
- Rendimiento: fortalezas en inglés no estadounidense y comprensión de imágenes
- Disponibilidad: AFM-on-Device puede usarse mediante el Foundation Models framework. AFM-Server no está disponible para uso público
- Soporte para 15 idiomas y uso de herramientas
- Información no revelada: no se han divulgado el número de parámetros del modelo de servidor, el límite de tokens ni los detalles del dataset de entrenamiento
Diferenciadores técnicos y optimización
- Cuantización (Quantization):
- El modelo on-device comprime la mayoría de los pesos a 2 bits y la capa de embeddings a 4 bits (usando entrenamiento consciente de cuantización)
- El modelo de servidor aplica ASTC (compresión usada en gráficos) y se comprime a un promedio de 3.56 bits (embeddings de 4 bits)
- Los adaptadores LoRA compensan la caída de rendimiento causada por la compresión y permiten adaptar el modelo a tareas específicas como resumen, corrección y preguntas y respuestas
- La arquitectura MoE personalizada minimiza la sobrecarga de comunicación entre hardware, mejorando la eficiencia
Evaluación de rendimiento
- Modelo on-device: supera a modelos rivales como Qwen2.5-VL-3B en inglés no estadounidense y comprensión de imágenes
- Modelo de servidor: en algunos casos queda ligeramente por delante de Qwen3-23B, pero no alcanza a modelos recientes como GPT-4o
Polémicas recientes y cambios en la estrategia de IA
- Apple generó polémica recientemente con un paper que experimentó con los límites de razonamiento de cinco modelos de IA recientes, al que poco después siguió un paper de refutación
- La actualización de Siri con IA fue pospuesta indefinidamente, y también se presentó una demanda colectiva por la falta de funciones de IA en el nuevo iPhone
- Mientras Google/Android avanza rápidamente en la competencia de IA, Apple está cambiando su estrategia con Foundation Models y otros esfuerzos
Perspectivas e impacto futuro
- Es muy probable que iOS ejerza una enorme influencia sobre el ecosistema de desarrolladores de apps al integrar estos modelos por defecto
- Debido a las limitaciones de memoria y capacidad del modelo, se espera que aumente el uso de los modelos provistos por Apple en lugar de que los desarrolladores integren directamente sus propios modelos de IA
- Se está observando si la estrategia de Apple de convertirse en plataforma de IA impulsará la innovación en apps y la expansión del uso de IA on-device
Aún no hay comentarios.