Fara-7B, desarrollado por Microsoft Research, es un agente de IA pequeño con 7 mil millones de parámetros que realiza directamente tareas en la computadora, como navegar por la web, llenar formularios y hacer reservas. En el benchmark WebVoyager logró una tasa de éxito de 73.5%, superando a GPT-4o (65.1%) y UI-TARS (66.4%). El modelo se ejecuta en la PC del usuario sin depender de la nube, lo que protege la privacidad de los datos, y adopta un enfoque de "soberanía de píxeles" que procesa clics del mouse, entradas de teclado y desplazamiento solo a partir de capturas de pantalla, con buena eficiencia (completa las tareas en un promedio de 16 pasos).
Su funcionamiento se basa en que fue entrenado con datos generados y comprimidos a partir de 145 mil trayectorias de tareas sintéticas mediante el sistema Magentic-One, y corre rápidamente en la NPU de las Copilot+ PC. Entre sus funciones de seguridad, solicita aprobación del usuario en los "Critical Point" y permite rastrear e intervenir en sus acciones con Magentic-UI. Está publicado con licencia MIT en Hugging Face y Microsoft Foundry.
También mostró un rendimiento destacado en otros benchmarks (Online-Mind2Web 34.1%, DeepShop 26.2%, etc.), aunque se señalan como limitaciones la caída de precisión en tareas complejas y los problemas de alucinación. Microsoft lo evalúa como una "prueba de concepto" y se espera que, al ser de código abierto, amplíe el ecosistema de desarrolladores.
Conclusión: Fara-7B muestra el potencial de los modelos pequeños y es un caso importante que abre la era de los asistentes personales de IA con menor dependencia de la nube. Se espera que en el futuro evolucione hacia una mayor seguridad e inteligencia mediante aprendizaje por refuerzo.
1 comentarios
Los modelos pequeños dependen demasiado del prompt, así que es difícil usarlos con facilidad... ¿la única respuesta es hacer pruebas repetitivas?