4 puntos por GN⁺ 2025-06-26 | Aún no hay comentarios. | Compartir por WhatsApp
  • Apple presentó nuevos modelos de IA visión-lenguaje (AFM, Apple Foundation Models) y el framework Foundation Models para desarrolladores (API), además de mejorar de forma importante el rendimiento y la eficiencia tanto de los modelos on-device como de los de nube
  • El modelo AFM on-device está compuesto por un transformador de 3B parámetros y un transformador visual de 300 millones de parámetros, con soporte para entradas de texto e imagen, además de funciones multilingües y de visión; el modelo de servidor usa una arquitectura MoE personalizada
  • Ofrece funciones potentes y acceso para desarrolladores, como compactación del modelo (cuantización y LoRA), soporte para 15 idiomas, comprensión de imágenes y uso de herramientas
  • El modelo on-device mostró ventajas frente a modelos rivales en comprensión de imágenes e inglés no estadounidense, pero el modelo de servidor queda por debajo de modelos recientes como GPT-4o
  • Está atrayendo atención el cambio en la estrategia de IA de Apple y su influencia dentro del ecosistema iOS, en medio de la reciente polémica por un paper de Apple y el retraso en la actualización de Siri con IA

Actualización importante de Apple Foundation Models (AFM)

  • Apple actualizó tanto sus modelos de IA on-device (integrados en móviles) como los alojados en servidor (AFM), con grandes mejoras en velocidad, eficiencia y rendimiento
  • También lanzó una nueva API para desarrolladores (Foundation Models framework), que permite invocar IA on-device en dispositivos con Apple Intelligence habilitado

Arquitectura y funciones clave

  • Entrada/salida: texto, imagen (hasta 65,000 tokens de entrada); la salida es texto
  • Arquitectura:
    • AFM-on-Device: transformador de 3 mil millones de parámetros, transformador visual de 300 millones de parámetros
    • AFM-Server: transformador personalizado Mixture-of-Experts (MoE) (número de parámetros no revelado), transformador visual de 1 mil millones de parámetros
  • Rendimiento: fortalezas en inglés no estadounidense y comprensión de imágenes
  • Disponibilidad: AFM-on-Device puede usarse mediante el Foundation Models framework. AFM-Server no está disponible para uso público
  • Soporte para 15 idiomas y uso de herramientas
  • Información no revelada: no se han divulgado el número de parámetros del modelo de servidor, el límite de tokens ni los detalles del dataset de entrenamiento

Diferenciadores técnicos y optimización

  • Cuantización (Quantization):
    • El modelo on-device comprime la mayoría de los pesos a 2 bits y la capa de embeddings a 4 bits (usando entrenamiento consciente de cuantización)
    • El modelo de servidor aplica ASTC (compresión usada en gráficos) y se comprime a un promedio de 3.56 bits (embeddings de 4 bits)
  • Los adaptadores LoRA compensan la caída de rendimiento causada por la compresión y permiten adaptar el modelo a tareas específicas como resumen, corrección y preguntas y respuestas
  • La arquitectura MoE personalizada minimiza la sobrecarga de comunicación entre hardware, mejorando la eficiencia

Evaluación de rendimiento

  • Modelo on-device: supera a modelos rivales como Qwen2.5-VL-3B en inglés no estadounidense y comprensión de imágenes
  • Modelo de servidor: en algunos casos queda ligeramente por delante de Qwen3-23B, pero no alcanza a modelos recientes como GPT-4o

Polémicas recientes y cambios en la estrategia de IA

  • Apple generó polémica recientemente con un paper que experimentó con los límites de razonamiento de cinco modelos de IA recientes, al que poco después siguió un paper de refutación
  • La actualización de Siri con IA fue pospuesta indefinidamente, y también se presentó una demanda colectiva por la falta de funciones de IA en el nuevo iPhone
  • Mientras Google/Android avanza rápidamente en la competencia de IA, Apple está cambiando su estrategia con Foundation Models y otros esfuerzos

Perspectivas e impacto futuro

  • Es muy probable que iOS ejerza una enorme influencia sobre el ecosistema de desarrolladores de apps al integrar estos modelos por defecto
  • Debido a las limitaciones de memoria y capacidad del modelo, se espera que aumente el uso de los modelos provistos por Apple en lugar de que los desarrolladores integren directamente sus propios modelos de IA
  • Se está observando si la estrategia de Apple de convertirse en plataforma de IA impulsará la innovación en apps y la expansión del uso de IA on-device

Aún no hay comentarios.

Aún no hay comentarios.