1 puntos por dunward 25 일 전 | Aún no hay comentarios. | Compartir por WhatsApp

Hola. Siempre hay personas que publican otras noticias más rápido que yo, así que por una u otra razón este terminó siendo mi primer post en Show GN.
Tenía curiosidad por saber si se puede predecir con un VLM hacia dónde mira el usuario en una UI, así que hice el experimento yo mismo y lo organicé en un paper.
Usé un dataset llamado UEyes para comparar los resultados de predicción de mirada del VLM con datos reales de eye tracking.

También consulté al primer autor de UEyes (cs.HC) para el endorsement de arXiv, y lo aceptó amablemente.

paper: https://arxiv.org/abs/2604.26352
github: https://github.com/dunward/uigaze

Aún no hay comentarios.

Aún no hay comentarios.