Comet - el Web Agent y navegador de Perplexity
(perplexity.ai)Comet: el nuevo navegador creado por Perplexity
Ya pasó un poco de tiempo desde su lanzamiento, pero lo probé después de pasar la lista de espera y quise escribir sobre ello.
Resumen clave
Comet es un navegador con IA desarrollado por Perplexity que maximiza la concentración y el flujo de trabajo del usuario, y convierte la curiosidad en capacidad de ejecución.
Funciones y características principales
-
Búsqueda integrada con IA, contexto inmediato y automatización de sitios
- Permite resumir, comprar, gestionar agenda e investigar directamente desde el navegador
-
Comet Assistant
- Automatiza tareas repetitivas como hacer clic, escribir, enviar y autocompletar
-
Automatización incluso para tareas complejas
- Da soporte a todo el proceso de compra, desde comparar productos hasta el pago
-
Gestión unificada
- Integración con correo y calendario (Gmail, Google Calendar)
- Resuelve dentro del navegador desde resúmenes de agenda hasta la programación de correos y eventos
-
Experiencia personalizada
- Aprende patrones de uso y organiza automáticamente pestañas e insights
-
Encuentra respuestas directamente desde mi actividad
- Soporta búsqueda en datos personales como historial, videos y documentos
-
Acciones inteligentes y enfoque por pestaña
- La función
@tabofrece respuestas en tiempo real según la pestaña abierta
- La función
Casos de uso
Perplexity también publicó casos de uso adicionales en LinkedIn
https://www.linkedin.com/company/perplexity-ai/posts/?feedView=all
Opinión personal después de usar el servicio
Tecnología
- Navegador Chromium + Perplexity + formato de Web Agent
- Consulta en lenguaje natural -> extracción de intent/slot -> mapeo de DOM semántico -> conversión a acción -> ejecución de eventos (web Tool) -> parseo y preprocesamiento de resultados -> se estima una estructura tipo ReAct
- Comet toma capturas de pantalla para permitir entender el estado actual de la tarea, pero hace falta verificar adicionalmente si analiza eso usando un modelo de visión
Casos de prueba
(1) Redacción de correo
- Redactó un correo usando adecuadamente el sitio web de Gmail
- El Agent eligió no enviarlo realmente y dejarlo guardado como borrador
(2) Búsqueda de ruta en Naver Maps + recomendación de restaurantes cercanos
- Después de entrar al sitio web de Naver Maps, se le pidió encontrar una ruta desde la estación de Seúl hasta Jamsil, y usó correctamente el servicio de Naver Maps (como lo haría una persona) para encontrarla
- Para buscar restaurantes cercanos, no utilizó Naver Maps sino la Search Tool existente de Perplexity
(3) Rastreo de precios de Open AI Platform
- Tengo entendido que Open AI Platform usa Remix, y algunos precios de API estaban ocultos detrás de toggles
- Se le pidió explícitamente a Comet abrir los toggles, verificar los precios de todas las API y entregar el resultado en Markdown, y lo hizo adecuadamente
- Aun así, se necesita prompt engineering para lograr una extracción precisa de la información
- También se le pidió revisar la página de API de Anthropic, pero como el layout de la página (dividers) era ambiguo, no logró parsear con precisión la política compleja de API. Los precios básicos de API sí los extrajo correctamente.
Opinión personal
- Al desarrollar un agente de navegación, seguramente hubo muchos puntos a considerar como contexto, rendering, etc.; me da curiosidad cómo lo habrán resuelto.
- A nivel técnico se ve un wow, pero desde la perspectiva de producto todavía parece algo ambiguo.
- Puede variar según la persona, pero yo todavía no tengo claro por qué debería usar este producto, por qué valdría la pena pagar por usar Comet y qué problema mío (como cliente) resolvería. Es decir, su propuesta de valor no me resulta clara por ahora. Hoy mi sensación es: “¡Oh! Qué curioso, esto sí funciona; lo usaré unas cuantas veces más cuando me acuerde”.
- Claro, Perplexity sí presenta casos de uso, pero me queda la duda de si “realmente es un problema que tenga que resolverse con un Agent? (si lo hago yo, es más rápido)” y también si “de verdad resolvió completamente el problema real”.
- Supongo con cautela que esto podría sentirse así porque el navegador está más cerca de ser infraestructura.
- Como un navegador basado en AI Agent es, de algún modo, un formato nuevo, creo que sería importante mostrar bien a los clientes algo como: “tú tienes este problema, y Comet realmente puede resolverlo por completo”.
- Creo que vale la pena seguir observándolo y usarlo un poco más. Me deja pensando en cómo podrían resolverse estos problemas de producto.
UI
Esto es un análisis personal. (Estoy trabajando en recrearlo a modo de ingeniería inversa...)
https://www.figma.com/deck/Gky9ZDEqZKdJfG4RWoNYdf
4 comentarios
Tengo una duda: cuando lo probaron, ¿había algún límite de uso para las consultas del agente de Comet? O, como con otras herramientas, ¿está en período de prueba y las consultas no importan? Recuerdo que había algo como Pro-Max, así que quería preguntar.
Ahora mismo tengo la suscripción Pro. Puede ser que yo la haya usado relativamente poco, pero incluyendo Comet, hasta ahora nunca me he topado con un límite en Perplexity. Incluso da la impresión de que es bastante holgado.
Como el plan de suscripción no muestra un
ratelimit, no lo tengo del todo claro.Por lo pronto, parece que la beta release la dieron de forma distinta a Pro Max.
https://perplexity.ai/help-center/en/…
Es una impresión personal, pero como dices, quizá por estar en periodo de pruebas parece que la cantidad de consultas no importa. Incluso confirmé que funciona levantando 12 navegadores virtuales en paralelo de una sola vez. Eso sí sorprende.
Lo leí bien.
Como era de esperarse, me da un poco de pena..
Coincido con eso.
Por ejemplo: cuando le pedí que leyera la página de noticias de Naver y resumiera el enfoque de cada periódico sobre la negociación arancelaria, inventó la postura de los periódicos que no había leído basándose en “prejuicios aprendidos de antemano sobre la tendencia de cada medio”, y respondió como si sí los hubiera leído.