auto-identity-remove - ejecutor automático de exclusión voluntaria de data brokers para macOS, Linux y Windows
(github.com/stephenlthorn)- auto-identity-remove es una herramienta que busca sitios de data brokers usando nombre e información de ubicación y envía automáticamente formularios de exclusión voluntaria para ayudar a eliminar información personal de más de 500 sitios de búsqueda de personas y bases de datos de data brokers cada mes
- El flujo de ejecución consiste en búsqueda por broker, detección de listas de perfiles específicos, envío del formulario de exclusión, resolución de CAPTCHA cuando sea necesario, omisión de elementos completados recientemente, notificación de resultados y apertura del navegador para sitios que requieren procesamiento manual
- El seguimiento de estado guarda en
state.jsonla última vez que tuvo éxito y el historial de ejecución, y el período de reverificación predeterminado es de 90 días, por lo que no vuelve a enviar cada vez las exclusiones ya completadas - Los formularios con CAPTCHA pueden procesarse mediante CapSolver, con un costo aproximado de $0.001 por resolución; si no se configura, ese sitio pasa a la lista de procesamiento manual
- Los requisitos son Node.js 18+, macOS, Linux o Windows, y el navegador de Playwright;
setup.jsguía la captura de datos personales, alias, clave de CapSolver, cuenta de un solo uso, notificaciones y el registro de una programación mensual - La tarea mensual se registra para ejecutarse el día 1 de cada mes a las 9:00 a. m., y según la plataforma detecta y usa automáticamente launchd, systemd, crontab o schtasks
- También admite ejecución con Docker, usando la imagen oficial de Playwright que incluye Chromium y dependencias del sistema; para conservar el historial de elementos completados entre contenedores, se debe montar
state.json - Las notificaciones admiten un resumen de resultados por iMessage en macOS, y en entornos headless o con Docker se puede hacer POST de
{"text": "<summary>"}mediantenotify.webhooka ntfy.sh, Slack incoming webhook o Discord webhook - El soporte de brokers se divide en dos etapas, y los 42 brokers explícitos organizados en STATUS.md se mapean con selectores individuales, mientras que alrededor de 490 se manejan con un enfoque heurístico que intenta en orden el botón Do Not Sell, OneTrust, TrustArc, Osano, formularios genéricos y búsqueda de enlaces DSAR
✅ Submittedsolo significa que el broker recibió el formulario, no que garantice la eliminación;node watcher.js --verifyvuelve a buscar los elementos exitosos registrados y los clasifica comoVERIFIED CLEAR,STILL LISTEDoUNVERIFIABLE- Entre los principales objetivos compatibles con procesamiento automático están Spokeo, WhitePages, FastPeopleSearch, TruePeopleSearch, BeenVerified, Radaris, Acxiom, LexisNexis, ZoomInfo y Clearbit, mientras que Google Results About You y Google Outdated Content se abren para procesamiento manual
- Los usuarios fuera de EE. UU. pueden usar código de país, Province/Region, código postal, almacenamiento del número telefónico original y entrada en campos de selección de país, pero los brokers solo para EE. UU. como Spokeo, WhitePages y FastPeopleSearch se omiten automáticamente si el país configurado no es
US --dry-runsolo realiza la navegación del sitio y el llenado de formularios sin enviarlos, y la función experimental--pollute Nenvía registros falsos a algunos brokers marcados conacceptsBogus: true, pero como se indica que puede violar los términos y generar riesgos legales, está desactivada por defectoconfig.json, que contiene datos personales,state.json, con el historial de exclusión, y los logs de ejecución están incluidos en gitignore, y la licencia del repositorio es MIT
1 comentarios
Comentarios en Hacker News
La parte en la que necesito ayuda es que el enfoque heurístico deja fuera demasiados casos. Muchos sitios tienen flujos únicos, así que no se cubren con cuatro estrategias generales
Hace falta alguien que valide qué sitios genéricos realmente funcionan y cuáles fallan en silencio, que agregue definiciones explícitas para brokers de alto valor, que pruebe fuera de entornos macOS y que maneje los flujos de verificación por correo electrónico
Repo: https://github.com/stephenlthorn/auto-identity-remove
El repositorio no contiene información personal; el script de configuración pide los datos localmente y están en gitignore
Para la verificación por correo, quizá se podría empezar con algo temporal como “haz clic en el enlace de confirmación del correo de cierto remitente”. Leer de forma confiable una bandeja de entrada real en varios proveedores probablemente requeriría, en la práctica, un cliente de correo, así que podría ser difícil
Y quizá no venga al caso, pero este mismo comentario también parece generado por IA. Si es así, eso viola las reglas del sitio
La idea es buena, pero todavía hay muchísimo que pulir para que sea útil de forma general. Parece que códigos postales no numéricos y direcciones fuera de EE. UU. rompen bastante la automatización
Revisándolo con compañeros de trabajo, el formulario de opt-out solo requería la dirección. Pensamos en reunir todas las direcciones conocidas del país y enviar opt-outs automatizados durante varios meses para darlas de baja a todas, pero nunca lo hicimos; solo nos reímos imaginando en qué porcentaje de opt-outs los desarrolladores web de Yellow Pages habrían convocado una reunión de emergencia
Los repartidores no daban abasto y al final empezaron a apilar y quemar montones de directorios. Como a nadie le hacían falta, tardaron bastante en descubrirlos
Intenté bastante evitar que Uline enviara sus enormes catálogos de papel al apartado postal dos o tres veces al año. Tienen un formulario, pero simplemente ignoran la solicitud
https://www.uline.com/CustomerService/ULINE_FAQ_Ans?FAQ_ID=4...
Eso no significa que ya no ocurra, pero sí da una base legal para enfrentarlo. noyb.eu / Max Schrems y otros están haciendo un trabajo excelente y muy importante en ese frente
reCAPTCHA v3 Enterprise y MtCaptcha cuestan nada menos que 3 veces más, a $3 por cada 1000 resoluciones. Así que estos parecen ser CAPTCHA atractivos para atacar
El soporte para systemd parece fácil. En Windows no sé bien qué se usa
Aun así, con el Programador de tareas puedes agendar de muchas maneras algo como ejecutarlo una vez al mes
El modelo de amenaza no está tan claro: la herramienta puede reducir la exposición, pero un selector roto también podría filtrar datos personales al lugar equivocado
Una solución mucho mejor sería impulsar en EE. UU. una ley similar al GDPR
Para los consumidores ya está disponible. Puedes unirte junto con tus 275 mil vecinos