2 puntos por GN⁺ 2025-04-08 | 1 comentarios | Compartir por WhatsApp
  • Una herramienta que conecta apps de IA al navegador mediante MCP para automatizar tareas en sitios web
    • Por ejemplo, automatiza tareas como rellenar formularios repetidamente en un sitio web
  • Automatización de flujos de trabajo: acelera las tareas y las automatiza para mejorar la eficiencia
  • Pruebas automatizadas: usa editores con IA para ejecutar automáticamente pruebas end-to-end del código. Prueba flujos de usuario, valida elementos de la UI y verifica que la aplicación funcione como se espera en distintos escenarios
  • Automatización de tareas: permite automatizar fácilmente tareas web repetitivas como recopilación de datos, llenado de formularios y automatización de flujos de trabajo, para ahorrar tiempo y reducir errores

Ventajas de Browser MCP

  • Velocidad: la automatización se realiza localmente, lo que mejora el rendimiento al eliminar la latencia de red.
  • Privacidad: como la automatización ocurre de forma local, la actividad del navegador permanece en el dispositivo y no se envía a servidores remotos.
  • Mantener la sesión iniciada: usa el perfil existente del navegador para conservar la sesión iniciada en todos los servicios.
  • Discreción: utiliza la huella digital real del navegador para evitar la detección de bots y los CAPTCHA.

Cómo usarlo

  1. Instalar la extensión Browser MCP: agrega la extensión Browser MCP al navegador.
  2. Configurar el servidor MCP: agrega el servidor Browser MCP a la aplicación de IA para conectarlo con la extensión del navegador.
  3. Iniciar la automatización: crea flujos de trabajo automatizados y deja que el asistente de IA gestione tareas repetitivas en el navegador.

Herramientas de automatización del navegador

  • Navegar: ir a una URL
  • Atrás: ir a la página anterior
  • Adelante: ir a la página siguiente
  • Esperar: esperar durante el tiempo especificado (segundos)
  • Presionar tecla: presionar una tecla del teclado
  • Instantánea: capturar una instantánea de accesibilidad de la página actual
  • Clic: realizar un clic en una página web
  • Arrastrar y soltar: realizar drag and drop entre dos elementos
  • Hover: pasar el cursor sobre un elemento de la página
  • Ingresar texto: introducir texto en un elemento editable
  • Seleccionar opción: elegir una opción en un menú desplegable
  • Obtener logs de consola: obtener los logs de consola del navegador

Aplicaciones de IA compatibles con MCP

  • Cursor
  • Claude
  • Windsurf
  • VSCode

1 comentarios

 
GN⁺ 2025-04-08
Opiniones de Hacker News
  • El sitio afirma que "usa huellas digitales reales del navegador para evitar la detección de bots y los CAPTCHA"

    • He probado sistemas similares, pero cuando la IA controlaba el navegador aparecían CAPTCHA y terminé bloqueado en varios sitios web
    • Cuando dejé de usar sesiones del navegador, los bloqueos se levantaron, pero este enfoque no es una solución universal
  • Este sistema parece una copia anticuada de Playwright-MCP de Microsoft

  • Sería útil tener un navegador que pueda filtrar productos en sitios de compras según condiciones específicas

  • No sé qué es MCP, y a estas alturas hasta me da miedo preguntar

  • La tarea de buscar información en la web e insertar los resultados en Google Sheets funcionó casi perfectamente al principio, pero falló en intentos posteriores

    • Me pregunto si hay un problema de latencia entre el navegador y la app MCP
    • En el primer intento hice clic rápido en el permiso de "permitir este chat", pero en los intentos siguientes el LLM reportó problemas al hacer clic
    • Hacer clic en el título de Google Sheets para escribir el nombre funcionó al principio, pero después falló
    • Identificar las celdas A1, B1, etc., e insertar datos en la fila también funcionó al principio, pero después falló
    • El primer intento fue casi perfecto, pero después no se pudo reproducir al 100%
    • La experiencia es fluida y la configuración y ejecución están muy bien logradas
  • Cuando lo probé en Claude Desktop, funcionó de forma fluida y fue menos engorroso que Playwright

    • Estaría bien que, al detectar un CAPTCHA en la página, pausara la automatización y avisara al usuario
    • Playwright sigue intentando resolver el CAPTCHA
  • Sería bueno poder navegar por la página usando el árbol de accesibilidad de las herramientas de desarrollo de Chrome

  • Esto me entusiasma para tareas manuales, especialmente cosas como solicitudes de reembolso

    • Cada mes es molesto iniciar sesión en el proveedor de servicios, descargar el estado de cuenta, redactar un documento de Google, escribir un correo y subir archivos
    • La automatización ya es posible, y una app real de seguimiento de gastos podría reducir a la mitad este trabajo
    • Las herramientas de IA tienen el potencial de eliminar las especificaciones detalladas
    • Estos flujos de trabajo suelen verse afectados por cambios pequeños
  • Me pregunto si MCP es el nuevo RPA (automatización robótica de procesos)

  • Hago un trabajo similar controlando sintetizadores de hardware para diseñar sonido sin tocar perillas físicas