- Con solo agregar una línea,
<script src="page-agent.js"></script>, un sitio web se convierte en una app nativa de IA
- Funciona incluso sin extensión del navegador, Python ni navegador headless
- Si le das instrucciones en lenguaje natural, la IA se encarga del resto. Gracias a la función de manipulación del DOM basada en texto, no hacen falta capturas de pantalla, OCR ni LLM multimodales
- Todo el procesamiento se realiza dentro de la página con un modelo de ejecución in-page, por lo que controla directamente los elementos del DOM sin pedir permisos adicionales
- Se pueden usar varios modelos como OpenAI, Claude, DeepSeek y Qwen, y también es posible un modo completamente offline con Ollama (integración basada en API key)
- Ofrece una UI interactiva y una interfaz human-in-the-loop
- También se puede probar en cualquier página web usando un bookmarklet
- Si instalas la extensión de Chrome, también soporta tareas que conectan múltiples páginas, así como control a nivel del navegador e integraciones externas
- Casos de uso principales
- SaaS AI Copilot: implementar un AI Copilot dentro del producto sin modificar el backend
- Automatización inteligente de formularios: acorta procesos de clics en varios pasos a una sola frase y mejora ERP, CRM y herramientas administrativas
- Mejora de accesibilidad: mejora la accesibilidad web mediante comandos de voz y lectores de pantalla
- Licencia MIT: el repo es alibaba/page-agent
11 comentarios
Wow, qué increíble..!!
Vaya, qué curioso.
Parece una buena opción para agregar fácilmente un LLM a la página con un bookmarklet. Si les incomoda que el bookmarklet predeterminado vaya a Alibaba (China), pueden especificar el endpoint de LLM que usan poniendo
baseURLyapiKey. (como un LLM local u OpenAI)javascript:(function(){import('https://cdn.jsdelivr.net/npm/page-agent@1.5.5/+esm').then(module=>{window.agent=new module.PageAgent({model:'gpt-5.4',baseURL:'<your-api-url>',apiKey:'<your-api-key>'});if(window.agent.panel)window.agent.panel.show();}).catch(e=>console.error(e));})();
Al principio pensé: ¿qué es esto y cómo se usa?, pero ahora ya lo entendí.
Instalé la extensión y, cuando le dije en Toss Securities que quería saber el precio de la acción de SOXL de hace 30 días, entró por su cuenta, lo manipuló y me dijo el precio.
También es mucho más rápido que conectar Playwright con IA.
Esto está causando revuelo en redes sociales... creo que tendré que probarlo.
Qué increíble, parece que de verdad hay muchísimas formas de aprovecharlo de inmediato.
Creo que bastaría con mejorar el aspecto de seguridad para poder usarlo.
Oh, está realmente interesante.
> Try on Other Sites
> Paso 2: arrastra este botón a tus marcadores
Y hay algo así en el sitio, y de verdad cuando lo arrastras se agrega a los marcadores.
Es la primera vez que lo veo y se me hace increíble; es una muy buena forma de compartir bookmarklets.
Ah... el bookmarklet de GeekNews también existe desde las primeras etapas del lanzamiento.
https://news.hada.io/bookmarklet
Vaya, no sabía que en GeekNews también había un bookmarklet tan bueno jajaja
Parece que hasta para la gente común sería fácil de usar, y de verdad se ve muy bueno
Qué interesante. Parece que Alibaba sacó otra cosa curiosa.
¿Quizá valga la pena probarlo en herramientas internas de administración del servicio?
Parece que si armas más o menos solo el CRUD y luego le indicas paso a paso que haga esto y aquello, se va creando un flujo de trabajo.
La demo funciona de forma interesante.
Esto se puede aplicar a cualquier sitio web usando un bookmarklet,
sin meterlo directamente en el código.