16 puntos por GN⁺ 2025-01-10 | 1 comentarios | Compartir por WhatsApp
  • Stagehand es un framework de navegación web con IA, simple y escalable, totalmente compatible con Playwright
    • Ofrece tres API de IA simples: act, extract y observe, que permiten la automatización web mediante lenguaje natural
    • Mejora la accesibilidad incluso para usuarios no técnicos y lo hace menos vulnerable a pequeños cambios en la UI/DOM
    • Ejemplos: extraer las noticias principales de Hacker News, buscar y comprar AirPods en Amazon, buscar las estadísticas de los últimos 10 partidos de Steph Curry en ESPN
  • Permite escribir fácilmente código de automatización de navegador duradero y con buen rendimiento.
  • Al usarse junto con Browserbase, ofrece excelentes herramientas de depuración como reproducción de sesiones y depuración paso a paso.
  • Stagehand se encuentra en una fase de lanzamiento inicial y está recopilando activamente comentarios de la comunidad.
  • Licencia MIT

1 comentarios

 
GN⁺ 2025-01-10
Comentarios en Hacker News
  • Hay quien opina que, al extraer datos de una página con Stagehand, sería bueno que devolviera elementos xpath para poder volver a raspar la página sin usar un LLM

    • Al raspar una página nueva se podrían usar herramientas LLM no deterministas, y al volver a rasparla para actualizar contenido se podrían usar métodos tradicionales de scraping
    • Surgen dudas sobre qué tan estable es la transición de la versión con LLM a una versión con xcode, y si se puede volver a la versión con LLM si el script de xcode falla
    • Se comenta que podría ser útil usar herramientas inteligentes para raspar primero y, con el tiempo, construir una biblioteca simple de scripts de scraping
  • No hay acuerdo con la idea de que Stagehand deba reemplazar a Playwright y similares

    • Personalmente, se querría usar como un flujo intermedio para generar código determinista de Playwright, pero esta herramienta parece pensada para ejecución directa
    • Se opina que sería difícil convencer a otros de usar un LLM en tiempo de ejecución dentro de una suite de pruebas en desarrollo
  • Se intentó implementar automatización de flujos de trabajo con un framework parecido, pero se detuvo por culpa de captchas invisibles

    • La instancia de Playwright podría ser detectada por la forma en que interactúa con el DOM
    • Se cree que el crawling y el scraping se están volviendo incontrolables, así que esto podría terminar siendo un estándar
  • Hay quien opina que el nombre "create-browser-app" es demasiado genérico y que debió llamarse "stagehand"

  • Antes de construir una plataforma de pruebas para testdriver.ai, se creó un SDK similar llamado Goodlooks, pero no tuvo mucha respuesta

    • Se comparte el enlace para quienes tengan interés
  • Tras probar Stagehand, se encontró que es una abstracción útil

    • Es útil para construir scrapers contra sitios web hostiles, ya que trae proxies y captchas integrados
    • Se pregunta si hay planes de hacer una abstracción similar para MCP y uso de computadoras
  • Gusta que Stagehand se enfoque en hacer la automatización del navegador más resistente a cambios en el DOM

    • Los métodos act, extract y observe son muy limpios
    • Se recomienda Lightpanda, un navegador headless ligero de código abierto
  • Se pregunta si existe la posibilidad de automatizar pestañas de navegador ya abiertas

  • Se ha estado viendo en Slack la increíble velocidad con la que este equipo desarrolla producto, y genera expectativa lo que venga después

  • Se pregunta si funciona convirtiendo métodos de IA en submétodos de Playwright, y si se pueden depurar los métodos reales convertidos

    • Hay dudas sobre si en cada ejecución de prueba podrían salir comandos distintos o si existe un comportamiento determinista