- Una nueva forma de usar el navegador
- Basado en Gemini 2.0, automatiza tareas del navegador aprovechando potentes capacidades multimodales de comprensión y razonamiento
- Comprende y razona sobre todos los elementos de la pantalla del navegador, incluidos píxeles, texto, código, imágenes y formularios
- Multimodalidad nativa: comprende y razona sobre todo el contenido en el navegador
- Analiza elementos complejos de los sitios web, como texto, código e imágenes
- Responde a comandos de voz y ofrece retroalimentación visual sobre el progreso de la tarea
- Interacción con el navegador: comprende y navega sitios web complejos en tiempo real
- Interactúa con los sitios web en lugar del usuario
- Automatiza tareas repetitivas para ahorrar tiempo
- Si no entiende un comando, solicita una aclaración clara
- Razonamiento: comprende instrucciones complejas y las divide en pasos ejecutables para llevarlas a cabo
- Identifica las relaciones y funciones entre los elementos web
- Muestra de forma transparente el proceso de planificación y ejecución para que el usuario pueda entender la toma de decisiones
- Actualmente solo está disponible para un pequeño grupo de pruebas de confianza: si quieres participar en las pruebas, debes registrarte en la lista de espera
1 comentarios
Aparece un navegador headless optimizado para IA…
los servidores web devuelven respuestas optimizadas para ese navegador…
y no falta mucho para el día en que hablen entre ellos(?)…