Comparación de cuánto puede predecir un VLM la mirada del usuario con datos reales de eye tracking
(arxiv.org)Hola. Siempre hay personas que publican otras noticias más rápido que yo, así que por una u otra razón este terminó siendo mi primer post en Show GN.
Tenía curiosidad por saber si se puede predecir con un VLM hacia dónde mira el usuario en una UI, así que hice el experimento yo mismo y lo organicé en un paper.
Usé un dataset llamado UEyes para comparar los resultados de predicción de mirada del VLM con datos reales de eye tracking.
También consulté al primer autor de UEyes (cs.HC) para el endorsement de arXiv, y lo aceptó amablemente.
paper: https://arxiv.org/abs/2604.26352
github: https://github.com/dunward/uigaze
Aún no hay comentarios.