Project Mariner de Google DeepMind - herramienta de automatización del navegador

xguru · 2024-12-18T11:07:01+09:00

Una nueva forma de usar el navegador Basado en Gemini 2.0, automatiza tareas del navegador aprovechando potentes capacidades multimodales de comprensión y razonamiento Comprende y razona sobre todos los elementos de la pantalla del navegador, incluidos píxeles, texto, código, imágenes y formularios Multimodalidad nativa: comprende y razona sobre todo el contenido en el navegador Analiza elementos complejos de los sitios web, como texto, código e imágenes Responde a comandos de voz y ofrece retroalimentación visual sobre el progreso de la tarea Interacción con el navegador: comprende y navega sitios web complejos en tiempo real Interactúa con los sitios web en lugar del usuario Automatiza tareas repetitivas para ahorrar tiempo Si no entiende un comando, solicita una aclaración clara Razonamiento: comprende instrucciones complejas y las divide en pasos ejecutables para llevarlas a cabo Identifica las relaciones y funciones entre los elementos web Muestra de forma transparente el proceso de planificación y ejecución para que el usuario pueda entender la toma de decisiones Actualmente solo está disponible para un pequeño grupo de pruebas de confianza: si quieres participar en las pruebas, debes registrarte en la lista de espera

(deepmind.google)

8 puntos por xguru 2024-12-18 | 1 comentarios | Compartir por WhatsApp

Una nueva forma de usar el navegador
Basado en Gemini 2.0, automatiza tareas del navegador aprovechando potentes capacidades multimodales de comprensión y razonamiento
Comprende y razona sobre todos los elementos de la pantalla del navegador, incluidos píxeles, texto, código, imágenes y formularios
Multimodalidad nativa: comprende y razona sobre todo el contenido en el navegador
- Analiza elementos complejos de los sitios web, como texto, código e imágenes
- Responde a comandos de voz y ofrece retroalimentación visual sobre el progreso de la tarea
Interacción con el navegador: comprende y navega sitios web complejos en tiempo real
- Interactúa con los sitios web en lugar del usuario
- Automatiza tareas repetitivas para ahorrar tiempo
- Si no entiende un comando, solicita una aclaración clara
Razonamiento: comprende instrucciones complejas y las divide en pasos ejecutables para llevarlas a cabo
- Identifica las relaciones y funciones entre los elementos web
- Muestra de forma transparente el proceso de planificación y ejecución para que el usuario pueda entender la toma de decisiones
Actualmente solo está disponible para un pequeño grupo de pruebas de confianza: si quieres participar en las pruebas, debes registrarte en la lista de espera

1 comentarios

iolothebard 2024-12-18

Aparece un navegador headless optimizado para IA…
los servidores web devuelven respuestas optimizadas para ese navegador…
y no falta mucho para el día en que hablen entre ellos(?)…

Project Mariner de Google DeepMind - herramienta de automatización del navegador

Lecturas relacionadas

1 comentarios