- El 73% de los visitantes de sitios web de e-commerce tiene una probabilidad muy alta de no ser personas reales, sino bots sofisticados
- Las herramientas de analítica estándar tienen dificultades para distinguir este tráfico de bots, lo que provoca una distorsión en el análisis del rendimiento publicitario y en el cálculo del ROI de marketing
- Bots de engagement, bots de abandono de carrito y bots de tráfico desde redes sociales imitan con gran precisión la actividad dentro de los sitios web siguiendo distintos patrones
- Una parte del tráfico de bots proviene de recolección de datos o automatización legítima, pero una proporción importante busca fraude publicitario o manipular métricas internas
- Actualmente, este problema no se limita a sitios específicos, sino que se está expandiendo como un reto amplio y sistémico para toda la industria
El inicio del problema: el misterio de una tasa de conversión de 0.1%
- El sitio web de un cliente de e-commerce registró 50 mil visitantes en un mes, pero las ventas reales apenas llegaron a 47
- En plataformas de analítica como Google Analytics, los datos parecían muy positivos, pero se descubrió que tenían poca relación con los ingresos reales
- A pesar de gastar 4,000 dólares al mes en publicidad, el crecimiento y las ganancias no guardaban ninguna proporción entre sí
- A diferencia de la sospecha inicial de que el problema era el producto, al analizar directamente los datos de tráfico del sitio web comenzaron a detectarse señales anómalas
- Para entender el problema, se desarrolló un script de seguimiento que monitoreaba la forma en que se comportan los usuarios reales
Primera investigación: seguimiento para verificar la verdad del tráfico
- Se desarrolló una herramienta de seguimiento que observaba patrones reales de comportamiento de usuario, no solo el conteo simple de clics
- Movimiento del mouse: análisis de curvas naturales frente a desplazamientos rectos y mecánicos
- Patrones de scroll: velocidad variable y pausas/retrocesos frente a scroll mecánico perfectamente uniforme
- Intervalos de interacción: medición de la variabilidad temporal entre clics, hover y agregados al carrito
- En solo una semana se confirmó que nada menos que el 68% del tráfico era no humano
- No se trataba de spam común, sino en su mayoría de bots astutos diseñados para engañar a las herramientas de analítica
La expansión del problema: no es un caso aislado, sino un fenómeno de toda la industria
- En foros de marketing y grupos de Discord, se preguntó a otros operadores de e-commerce: "¿Han vivido una diferencia entre tráfico y ventas?"
- Tras obtener permiso para instalar el script de seguimiento en más de 200 sitios web pequeños y medianos de e-commerce, una investigación de 6 meses confirmó que en promedio, el 73% era tráfico falso (bots)
- Esto no es un problema individual, sino un problema estructural de todo el ecosistema de comercio digital
La estructura del fraude publicitario moderno: análisis por tipo de tráfico
-
Bot de engagement
- Bots diseñados para hacer que los reportes de analítica se vean bien, simulando el comportamiento de visitas de alta calidad
- Realizan interacciones complejas como scroll de página, hover sobre productos y clics en enlaces internos
- Defecto fatal: consistencia perfecta
- Permanecen exactamente entre 11 y 13 segundos en cada página de descripción de producto
- La velocidad de scroll siempre se mantiene constante en 3.2 páginas por segundo
- El comportamiento humano es irregular, pero estos bots son clínicamente precisos
-
Bot de abandono de carrito
- Agregan el mismo producto al carrito, lo mantienen durante 4 minutos y luego lo abandonan, repitiendo el proceso decenas de veces al día
- Lo repiten con distintas IP y sesiones, posiblemente con el objetivo de distorsionar deliberadamente métricas clave de e-commerce como la tasa de abandono del carrito o manipular algoritmos internos de recomendación
-
Bot de tráfico desde redes sociales
- Tráfico que aparece en las herramientas de analítica como si viniera de Instagram, TikTok u otras plataformas
- Aproximadamente el 64% de estos casos espera exactamente 1.8 segundos después de llegar a la página antes de salir
- Abandonan de inmediato sin hacer scroll ni clic, pero aun así se contabilizan como "visitantes desde redes sociales"
- Elemento central del fraude publicitario: sirve para que vendedores de engagement falso "demuestren" que enviaron tráfico
No todos los bots son maliciosos: scraping legítimo de datos
- Información proporcionada por una persona de la industria de datos para e-commerce: se hace scraping de 70 millones de páginas minoristas al día
- Con fines legítimos de business intelligence
- Los grandes retailers como Amazon no siempre notifican a los proveedores cuando se quedan sin inventario
- Las marcas pagan por servicios de scraping de datos para monitorear sus propios productos
- Verificación de niveles de inventario, análisis de competencia por la buy box y validación de la precisión de las descripciones de producto
- Seguimiento del ranking en resultados de búsqueda por región y por dispositivo móvil
- Análisis de banners publicitarios por audiencia objetivo
- Según un video de Kurzgesagt, casi el 50% del tráfico total de internet es de bots
- Parte de eso corresponde a análisis competitivo y monitoreo de precios legítimos, pero una porción considerable es tráfico fraudulento que consume presupuestos publicitarios
La economía rota de la publicidad digital
- Un cliente gastaba 12 mil dólares al mes en Google Ads
- Después de implementar detección y filtrado avanzado de tráfico de bots:
- El tráfico reportado cayó 71%
- El CFO quedó inicialmente en shock
- Pero las ventas reales aumentaron 34%
- Los esfuerzos reales de optimización de la tasa de conversión (CRO) habían funcionado desde el principio, pero estaban sepultados bajo una avalancha de clics falsos
- Se desperdiciaban miles de dólares en mostrar anuncios a robots programados para nunca comprar
- El ROI de marketing pasó instantáneamente de ser "terrible" a "excelente"
-
La reacción de las plataformas publicitarias
- En conversaciones con las principales plataformas publicitarias, la actitud cambiaba de inmediato cuando se mencionaba fraude de clics o tráfico de bots
- "Nuestra detección con IA está entre las mejores de la industria"
- "Tomamos el fraude publicitario muy en serio"
- Un responsable admitió extraoficialmente: "Todos lo saben"
- "Si se filtrara correctamente, los ingresos caerían 40% de un día para otro y los inversionistas entrarían en pánico"
- Hay un enorme conflicto de interés: las plataformas publicitarias ganan dinero por clic o por impresión, sin importar si proviene de un cliente potencial o de un servidor de click farm
¿Le estás haciendo publicidad a robots? Guía práctica para detectar tráfico falso
-
1. Auditoría de picos de tráfico vs. datos de ventas
- ¿Un aumento de tráfico coincide con un aumento de ventas?
- Si al lanzar una promoción el tráfico se duplicó, pero las ventas siguen estancadas, hay una alta probabilidad de tráfico fraudulento
-
2. Análisis de métricas de comportamiento de usuario
- Busca cifras "demasiado perfectas"
- ¿El "tiempo promedio en página" de las páginas clave de aterrizaje es sospechosamente estable mes tras mes?
- El comportamiento humano real es irregular y variable
-
3. Segmentación de datos geográficos
- ¿Hay una cantidad considerable de tráfico desde países a los que no haces envíos?
- Si esos visitantes no convierten, es una señal importante de tráfico de baja calidad o falso
-
4. Investigación de fuentes de referencia
- Analiza con detalle las principales fuentes de tráfico
- Si los sitios de referencia parecen irrelevantes o de baja calidad, podrían formar parte de una red de intercambio de tráfico
- Busca "ghost referrals" en los que en realidad no existe ningún enlace hacia tu sitio
-
5. Confía en tu intuición
- Si las cifras se sienten extrañas, es muy probable que realmente haya un problema
- La intuición de un dueño de negocio que conoce a su base de clientes es una herramienta valiosa para detectar bots
La conclusión incómoda: un castillo digital de arena
- Un fundador de startup levantó 2 millones de dólares de inversión basándose en métricas de "crecimiento de usuarios"
- Más tarde descubrió que el 80% de esas métricas eran bots
- Ahora, si reconoce la verdad, podría poner en riesgo la empresa y la relación con los inversionistas, así que todo sigue disfrazado como si fuera normal
-
La economía oculta de los bots
- Las plataformas publicitarias venden impresiones a bots
- Las empresas compran tráfico falso para inflar sus métricas
- Las firmas de analítica reportan diligentemente esta actividad de bots
- Toda la industria participa en una mascarada colectiva, por miedo a que admitir la verdad derrumbe un sistema frágil
-
Perspectiva final
- Más de la mitad de internet es una ilusión, una obra digital donde bots actúan para otros bots
- Esa proporción sigue creciendo cada día a medida que la IA y la automatización se vuelven más sofisticadas
- La pregunta ya no es "¿Tu negocio está siendo afectado?"
- La verdadera pregunta es: "¿Qué pasará cuando este castillo digital de arena finalmente se derrumbe?"
2 comentarios
Ahora no solo hay bots headless, sino que también están apareciendo bots agente como comet browser, así que la detección se vuelve todavía más difícil.
Comentario en Hacker News
Dirijo una agencia de marketing, y los datos analíticos de un cliente no tenían ningún sentido (50 mil visitantes y 47 ventas), así que empecé a investigarlo a fondo. Entonces analicé más de 200 sitios de ecommerce pequeños y medianos rastreando el comportamiento de usuarios con un script sencillo. En promedio, el 73% de todo el tráfico visitante era tráfico de bots que las herramientas de analítica estándar registraban como visitantes reales. Los bots ahora son increíblemente buenos para imitar el comportamiento humano. También resumí patrones extraños que vi personalmente y conversaciones informales que tuve con gente de la industria adtech. Lo sorprendente es que este tráfico de bots es un secreto a voces que todos conocen pero del que nadie habla abiertamente. Da la impresión de que todo este sistema funciona apoyado en esos bots. Me pregunto si otros desarrolladores, fundadores o mercadólogos también han visto datos con discrepancias parecidas
Cuando trabajaba en las páginas amarillas de Suiza, los clientes de pago tenían un panel donde podían ver el número de visitantes de la página de su negocio. Cuando nuestro equipo de desarrollo filtró el tráfico de bots, las cifras cayeron más de un 50%. En menos de un día, el área de negocio pidió que quitaran el filtro. Al final, a los bots también se les consideró personas reales
¿Realmente importa si todo es fraude? Si hubo 47 compras reales, se puede juzgar si la campaña fue exitosa viendo cuánto se gastó en publicidad en ese periodo y comparándolo con los datos anteriores y posteriores. Con la publicidad exterior o los anuncios en autobuses tampoco te preocupas por quién los ve ni si los ve una persona real. Lo importante al final es el impacto real en las cifras
Doy consultoría de analítica web, y en 2021 investigué patrones extraños de tráfico en una empresa global de logística. Lo resumí en mi blog en este artículo. El problema del tráfico de bots existe desde hace mucho tiempo, y aunque han surgido muchos “servicios de detección de fraude publicitario” para frenarlo, todavía casi no he visto ninguno realmente útil. La pregunta de “¿cómo lo resolvemos?” siempre queda al final, pero nadie sabe cómo detener por completo a los bots. La mayoría de los consumidores usa plataformas grandes como Google, Facebook, Instagram, TikTok y LinkedIn, y en la práctica no existen redes publicitarias alternativas con pocos bots. Todos saben que una parte es falsa, y aun así siguen comprando ese tráfico. Para que esto cambie, las grandes tecnológicas con miles de millones de dólares en ingresos publicitarios tendrían que tener un incentivo aún mayor para cambiar el sistema que para mantenerlo. Por ahora, ni siquiera sienten la necesidad de preocuparse. “La mitad del dinero que gasto en publicidad se desperdicia. El problema es que no sé cuál mitad.” - John Wanamaker
Me pareció interesante el tema del tráfico de “bots buenos”. Durante mi investigación, una persona de la industria de datos me dio una pista enorme: en su empresa recolectaban diariamente 70 millones de páginas web de retail. Esa es una fuente gigantesca de tráfico legítimo de bots. Por ejemplo, como Amazon no avisa a los proveedores cuando se quedan sin inventario, las marcas usan servicios de scraping de datos para rastrear el estado de inventario de sus productos, la competencia por la ventaja del
Buy Box, si las descripciones de producto son adecuadas, el ranking en búsquedas e incluso qué banners publicitarios se muestran a qué audiencias. Incluso estos “bots buenos” pueden verse de forma distinta según la perspectiva. No me gusta que un competidor raspe mi sitio, pero sí me parece bien cuando yo recopilo datos del mercado. Si alguien lo programó y lo mantiene corriendo, es un bot que le beneficia a esa persona. Los creadores de contenido ven mal el scraping para IA, pero quienes hacen IA lo ven bien. Los sitios de comparación de precios confían en la nobleza de sus propios crawlers, y los retailers los detestan. Que el tráfico de bots sea “bueno” o “malo” depende del punto de vistaCoincido en eso de que todo este sistema está basado en bots. Nunca fui especialmente rebelde, pero una parte de mí que conserva el optimismo de los primeros días de internet quisiera ver cómo el modelo publicitario se hace pedazos. La verdad es que, incluso cuando la publicidad funciona “normalmente”, siempre ha tenido un olor inherente a explotación y engaño. Por ejemplo: mensajes del tipo “si no compras este producto, tus amigos te van a odiar”
Me parece interesante el estilo del artículo. El patrón de “no solo X, sino...”, las negritas, las listas con viñetas, todo se siente como un estilo ChatGPT que he visto muchas veces. Claro, no hay problema en recibir ayuda de ChatGPT, pero irónicamente el contenido del artículo tiene un tono muy de IA. Si el autor realmente escribe así, quizá signifique que ChatGPT fue ajustado a ese estilo. Me pregunto si la comunicación de la industria adtech siempre ha sido así
De hecho, la verdadera ironía es que este texto, aun siendo un ejemplo de un humano usando bien un “lenguaje de plantilla”, puede malinterpretarse por sonar superficialmente a IA. “No es X sino Y” es una estructura con un propósito muy claro: como el autor sabe que el lector tenderá a pensar X, cambia la perspectiva hacia Y. En el texto pasa con frases como “no solo conté clics, sino que observé comportamientos” y “no son solo bots que entran y salen del sitio, sino bots que imitan el comportamiento humano”; lo que hace es diferenciar con claridad lo que el lector espera de lo que realmente ocurre. También sería interesante estudiar cómo distinguir entre rasgos de estilo de IA y escritura humana con contenido significativo. Hasta me hace pensar que en el futuro podrían surgir problemas así en educación superior o en contratación, donde se intente distinguir entre IA y humanos de esta manera
Perdí el interés en la parte de “comenzó con un problema simple y fatal”. Y luego el desarrollo de “sentí una sensación extraña y desagradable” también se me cayó. Además, parece que el autor al final vende herramientas publicitarias por su cuenta
Justo por eso este tipo de textos se sienten todavía más irónicos. Al menos lo bueno es que la gente ya puede detectar rápido este tipo de escritura superficial e ignorarla. Las startups quieren fracasar rápido, pero yo quiero detectar rápido el contenido generado por IA y saltármelo
Detecté enseguida las características de texto con aire de IA y bajé directo a los comentarios. Si a simple vista parece un texto generado por IA, eso ya da la señal de que ni siquiera lo escribieron o editaron directamente, así que automáticamente pierde credibilidad
La imagen también parece generada por IA, o por lo menos como un clipart fuera de lugar
Llevo 15 años trabajando en la industria adtech, y creo que incluso gigantes como Google/FB engañan a los usuarios. No permiten doble tracking y te obligan a confiar en sus propias cifras, y cuando ves las IP de los clics, a veces aparecen IP de centros de datos de FB/Google. En realidad, el tráfico que viene de ahí es una manera de tomar usuarios que de todos modos iban a comprar en mi sitio, ejecutar algoritmos sobre ellos y hacerlos pasar como si fueran resultados de sus anuncios. Hay algunas empresas que intentan medir bien los indicadores de impacto, pero son muy pocas. Los sitios que muestran anuncios solo molestan a los usuarios y no obtienen ningún beneficio. Los anunciantes solo gastan dinero y no reciben nada. Al final, los únicos que ganan son los intermediarios
Cuando hago publicidad en Google, es como pagarle a alguien para que reparta volantes frente a mi tienda. Puede que la mayoría de mis visitantes haya llegado con el volante de Google Ads, pero no tengo idea de cuántos de esos visitantes son realmente clientes nuevos
Facebook Ads y SA360 sí soportan tracking de terceros, y puedes usar varias herramientas analíticas externas. Eso de que las IP aparecen como centros de datos de FB/Google me suena demasiado simplista, es la primera vez que lo escucho. ¿Las grandes empresas no van a tener VPN? Y eso de que “roban tráfico orgánico con algoritmos” no me hace sentido. Yo también llevo más de 10 años en la industria, pero esa afirmación no me resulta convincente. Uno puede llevar 15 años en esto y aun así no entender bien la industria ni la tecnología
Yo pensaba que en la industria todos sabían desde hace tiempo que las cifras de tráfico suelen ser ficticias y que más de la mitad de los datos de clics publicitarios son fraude. Así que que el OP, que presume hacer “análisis preciso del gasto publicitario”, apenas se esté enterando me resulta poco creíble. Esa parte no tiene nada de nueva, y me hace sospechar que de verdad diga que apenas lo descubrió. En cambio, la parte donde clasifica varios patrones de bots sí me pareció interesante, y no había visto un texto que hablara de eso con ese nivel de detalle
Parte de la gente del sector lo sabe desde hace años, pero la situación se está volviendo cada vez más grave. Mi teoría, después de trabajar con equipos de marketing durante los últimos 10 años, es que la mayoría confía en los números sin cuestionarlos. Sobre todo porque los equipos solo sobreviven si sus métricas crecen exponencialmente cada año, así que las cifras infladas más bien les convienen, y lo que no se vende simplemente se le echa la culpa al equipo comercial
En mi startup anterior también metimos muchísimos recursos de marketing y desarrollo en optimizar el funnel de conversión, pero la dirección del negocio en sí estaba equivocada. Si no nos hubiéramos dejado arrastrar por ruido de datos inútil, quizá habríamos podido cambiar de rumbo más rápido
Esto es algo que en la industria todos saben desde hace más de 10 años. En cierta medida, es un texto de marketing para una empresa llamada datacops
Veo mucha reacción de “¿¡apenas se dio cuenta el OP!?”, pero parece que esta empresa (Datacops) empezó hace poco. De hecho, da la impresión de que publicaron este texto justo a tiempo para el lanzamiento del producto. Referencia
Para mí, 47 conversiones con 50 mil de tráfico sugiere que la proporción de tráfico falso ya es mucho peor. Antes quizá la mitad era fraude, pero ahora da la impresión de que los usuarios reales son apenas una minoría insignificante
Si lanzas anuncios en Facebook y de repente entra una oleada de tráfico fraudulento, me pregunto quién operaría esos bots y con qué objetivo. Facebook tendría cierto incentivo, claro, pero si los descubren sería devastador, así que no creo que se atrevan. ¿Competidores? Parece demasiado sofisticado técnicamente como para hacerlo solo para quemar mi presupuesto, y tampoco sé si de verdad alguien contrataría a una fuerza oscura para eso. ¿Las agencias? Si los datos están hechos un desastre, enseguida les pedirían devolver el dinero de la pauta, así que tampoco suena probable. Entonces, ¿quién y para qué?
Probablemente sean bots que simplemente están simulando parecer personas reales. Tal vez no estén eligiendo específicamente mis anuncios para hacer clic, sino intentando imitar indiscriminadamente a usuarios reales
En Facebook Ads no solo se paga por clic; también hay modelos de pago por venta real o por conversión, así que ahí el incentivo es más claro
Te recomiendo revisar el caso de methbot. En la mayoría de los casos buscan ingresos publicitarios: operan bots para engañar a los algoritmos y desviar tráfico hacia contenido o páginas que ellos mismos publicaron, y luego se hacen pasar por personas reales para atraer todavía más presupuesto publicitario. Estructuralmente, eso hace que sea muy difícil para FB/Google filtrarlo por completo
Aunque uno piense “¿de verdad Facebook haría eso?”, históricamente siempre ha sido ingenuo confiar en “la empresa” cuando se trata de este tipo de métricas. Es una regla que aplica a cualquier compañía. Si el beneficio esperado supera el costo más el riesgo de ser descubiertos, actúan
Puede que no sea Facebook directamente, y mientras los anunciantes sigan comprando anuncios tampoco tienen mucho incentivo para preocuparse por el problema
Ojalá publicaran el script. Quisiera revisar si la metodología estuvo bien hecha y si por casualidad no están confundiendo usuarios normales con bloqueadores de anuncios o con JavaScript desactivado con bots. Ese 73% ni siquiera me sorprende; yo esperaría más. La parte impactante es que, cuando mencionas bots o fraude de clics a los equipos comerciales de plataformas publicitarias, la conversación de pronto cambia a un tono corporativo rígido. Todavía recuerdo que un vendedor que conocía bien me confesó off the record: “todos lo sabemos. Todos lo sabemos, pero si de verdad filtráramos todo correctamente, los ingresos caerían 40% de la noche a la mañana y los inversionistas armarían un escándalo”
Si los incentivos del equipo de marketing están armados alrededor de métricas de vanidad, entonces los problemas de conversión se ven solo como algo de etapas posteriores del funnel. Incluso en startups de venture hay un incentivo claro para dejar pasar registros de bots a propósito y así mostrar cifras infladas a los inversionistas
Cuando escuchas un testimonio como “si lo filtráramos bien, el 40% de los ingresos se evaporaría”, dan ganas de pensar que esto amerita una demanda colectiva
Cuando trabajé en el equipo de operaciones publicitarias de Lycos a principios de los 2000, ya vi auditorías internas que mostraban proporciones de bots de entre 25% y 75%. Ya entonces trataron de frenarlo, pero no sirvió de mucho, y sigue igual hoy. La publicidad online es en su mayor parte tirar dinero. Parece crear actividad económica, pero en realidad desperdicia tiempo y recursos
Como no se mencionaron medidas concretas de defensa contra bots, agrego algunas cosas: si refuerzas mucho la prevención de bots (por ejemplo con CAPTCHAs), el abandono de usuarios reales aumenta bastante. Eso afecta gravemente la tasa de conversión. A medida que los bots se parecen más a humanos, creo que este problema debe resolverse en la etapa de análisis y atribución, no perjudicando la usabilidad
Este es un caso real que me tocó vivir
Pero lo que me da curiosidad es cómo ese filtrado de bots se traduce directamente en una reducción del gasto publicitario. Por ejemplo, ¿se le puede avisar directamente a Google Ads “no quiero pagar por estos clics”? ¿O más bien ajustaron el targeting para evitar a los bots?
Uno puede imaginar que, al bloquear tráfico de bots, el retargeting se use con más precisión sobre personas reales y por eso suban las conversiones
Supongo que si el sistema de filtrado determina “esto es un bot”, entonces simplemente ya no le muestra el anuncio
Si se mezclan bots al construir audiencias de lookalike o de remarketing, eso puede mandar señales equivocadas a plataformas como Facebook. Y no, en Google Ads no puedes decir “por este clic no quiero pagar” para clics concretos
Hace tiempo vi un artículo parecido que decía algo como “el mercado de la publicidad web es, en esencia, casi todo falso/fraudulento/de bots, y todas las empresas y toda la industria se mantienen ignorando ese hecho”. Muchos empleos, empresas e industrias enteras dependen de no reconocerlo