8 puntos por xguru 2024-12-18 | 1 comentarios | Compartir por WhatsApp
  • Una nueva forma de usar el navegador
  • Basado en Gemini 2.0, automatiza tareas del navegador aprovechando potentes capacidades multimodales de comprensión y razonamiento
  • Comprende y razona sobre todos los elementos de la pantalla del navegador, incluidos píxeles, texto, código, imágenes y formularios
  • Multimodalidad nativa: comprende y razona sobre todo el contenido en el navegador
    • Analiza elementos complejos de los sitios web, como texto, código e imágenes
    • Responde a comandos de voz y ofrece retroalimentación visual sobre el progreso de la tarea
  • Interacción con el navegador: comprende y navega sitios web complejos en tiempo real
    • Interactúa con los sitios web en lugar del usuario
    • Automatiza tareas repetitivas para ahorrar tiempo
    • Si no entiende un comando, solicita una aclaración clara
  • Razonamiento: comprende instrucciones complejas y las divide en pasos ejecutables para llevarlas a cabo
    • Identifica las relaciones y funciones entre los elementos web
    • Muestra de forma transparente el proceso de planificación y ejecución para que el usuario pueda entender la toma de decisiones
  • Actualmente solo está disponible para un pequeño grupo de pruebas de confianza: si quieres participar en las pruebas, debes registrarte en la lista de espera

1 comentarios

 
iolothebard 2024-12-18

Aparece un navegador headless optimizado para IA…
los servidores web devuelven respuestas optimizadas para ese navegador…
y no falta mucho para el día en que hablen entre ellos(?)…