- El desarrollador de NanoClaw, con 18,000 estrellas en GitHub, reveló que al buscar el nombre del proyecto en Google aparece un sitio falso por encima del sitio oficial
- Un sitio falso generado automáticamente (nanoclaw[.]net), creado por alguien que scrapeó el README del proyecto, ocupa el segundo lugar en los resultados de Google, mientras que el sitio oficial real no aparece ni después de la página 5
- Aunque tomó todas las medidas legítimas posibles, como optimización SEO, envío a Google Search Console y obtención de enlaces desde coberturas en medios IT importantes, los resultados de búsqueda de Google no cambiaron
- Como en el sitio falso podrían insertarse malware o enlaces de phishing, en un proyecto diseñado con foco en seguridad, la mayor vulnerabilidad de seguridad terminó siendo la propia Búsqueda de Google
- Si Google no puede mostrar el resultado correcto incluso cuando todas las señales apuntan claramente a una sola respuesta, se pone en duda la confiabilidad de Google como puerta de entrada a la información en internet
NanoClaw y el origen del problema del sitio falso
- NanoClaw es un proyecto open source con diseño centrado en la seguridad: todos los agentes se ejecutan en contenedores aislados y su eje principal es un runtime sandbox seguro
- Tras su lanzamiento el 2 de febrero, creció rápidamente y fue cubierto por medios importantes como CNBC, VentureBeat y The Register
- Al principio del lanzamiento no tenía un sitio web propio, y el repositorio de GitHub era esencialmente el proyecto; el enfoque estaba en desarrollar funciones y construir comunidad
- Hacia el 8 de febrero, alguien registró el dominio nanoclaw[.]net y creó un sitio generado automáticamente con contenido scrapeado del README
- Al inicio incluía el enlace correcto al GitHub, así que no se percibió como un problema grave
Expansión del daño causado por el sitio falso
- A medida que el proyecto creció, cada vez más usuarios comenzaron a enviar consultas como “tu sitio web tiene un error”, “¿tu sitio tiene anuncios?” o “¿por qué se ve así en móvil?”
- Ese sitio publica información incorrecta sobre el proyecto e incluso falsifica las fechas de publicación
- Miles de usuarios estaban confundiendo ese sitio con el oficial, y la primera impresión de NanoClaw se estaba formando a partir de una página torpe y llena de anuncios
- El daño se acumula cada día, y es posible que ya cientos de miles de personas hayan estado expuestas a información incorrecta
Construcción del sitio oficial y esfuerzos de respuesta SEO
- Hace dos semanas se construyó el sitio oficial nanoclaw.dev y se tomaron todas las medidas posibles
- Enlazar el sitio oficial desde el repositorio de GitHub
- Aplicar datos estructurados y optimización SEO adecuada
- Enviarlo unas 15 veces a Google Search Console
- Conseguir enlaces al sitio real desde artículos de medios como The Register, VentureBeat y The New Stack
- Publicar un post de blog que llegó al puesto #1 en Hacker News
- Traducir el sitio a 15 idiomas
- Enlazar a nanoclaw.dev desde todos los perfiles sociales
- Presentar solicitudes de retirada (takedown notice) a Google, Cloudflare y al registrador de dominios spaceship.com
- Aunque todas las señales en internet apuntan a nanoclaw.dev como el sitio oficial, los resultados de búsqueda de Google no cambian
El problema estructural de la Búsqueda de Google
- En el repositorio de GitHub de NanoClaw, que aparece en el primer lugar de Google, el campo de sitio web indica explícitamente nanoclaw.dev
- Aun así, Google sigue mostrando el sitio falso por encima del oficial
- Expertos en SEO aconsejaron “solo hay que ganar en SEO” o “compra Google Ads”, pero el verdadero problema es que un desarrollador de open source tenga que librar una guerra de SEO por el nombre de su propio proyecto
- Esto no es un problema de SEO, sino un problema de Google
Riesgo de seguridad
- NanoClaw es un proyecto orientado a la seguridad, enfocado en la seguridad y el sandboxing del runtime de agentes
- En este momento, la mayor vulnerabilidad de seguridad del proyecto es la propia Búsqueda de Google
- El operador del sitio falso podría insertar en cualquier momento estafas con criptomonedas, páginas de phishing o enlaces de descarga maliciosos
- También podría hacer fork del repositorio de GitHub, inyectar código malicioso y enlazarlo desde el sitio falso que Google presenta como legítimo
- Google está habilitando en tiempo real un riesgo de seguridad activo en esta situación
Dudas fundamentales sobre la confiabilidad de Google
- Incluso en una consulta donde el propio proyecto declara claramente la respuesta, todas las señales coinciden y no hay ambigüedad, Google no logra mostrar el resultado correcto
- Esto plantea una duda de fondo sobre si se puede confiar en Google para información importante sobre elecciones, vacunas, salud o finanzas
- Hay que dejar de culparse pensando si las meta tags o el formato del favicon eran perfectos: si Google muestra resultados incorrectos pese a tener señales abundantes y claras, la responsabilidad es de Google
- Si Google quiere mantener su posición como puerta de entrada a la información en internet, tiene que ser capaz de resolver problemas básicos como este
4 comentarios
Los spammers de SEO de verdad se esfuerzan muchísimo.
Ahora mismo lo busqué y ya no aparece, pero sí hace falta seguir buscando los productos que uno mismo crea para ir revisándolos.
Yo también siempre estoy pendiente del ranking de tráfico por términos de búsqueda en GeekNews. Si administras un sitio web, revisar Search Console es indispensable.
Si buscas nanoclaw, nanoclaw.net todavía aparece debajo de git.
Parece que los datos estructurados son importantes.
Opiniones de Hacker News
Hace unos años ayudé gratis a John Reilly cuando publicó en HN un post llamado “How I ruined my SEO”
Él documentó ese proceso en su blog
Si quiere, también estaría dispuesto a ayudar esta vez
La solución más rápida sería hacer un mapeo de backlinks del sitio .net y enviar correos a los medios que enlazaron mal
Decirles “este enlace lleva a un sitio falso, el real es este” hace que sorprendentemente muchos lo corrijan
Solo con eso la situación podría cambiar
Además, si agregan datos estructurados y schema a nanoclaw.dev, los motores de búsqueda y los LLM lo reconocerán mejor
En resumen, el consejo práctico sería
Consulten esta hoja de cálculo con la lista de backlinks
Me parece una oferta muy generosa
Pero desde la perspectiva del autor, debe sentirse injusto tener que arreglar por su cuenta un problema creado por Google
Se siente poco justo que una empresa con miles de millones de dólares ni siquiera pueda distinguir el enlace oficial que está claramente en GitHub, y que al final sea una persona la que tenga que gastar tiempo en resolverlo
Se siente desalentador tener que hacer este tipo de trabajo SEO innecesario
Este problema no es de un solo sitio
Muchísimos proyectos open source están pasando por lo mismo
En el fondo, es un problema que Google debería arreglar
Excelente consejo
Buen feedback
Visto desde fuera, parece que la versión .net quedó arriba porque recibió enlaces de medios de alta autoridad como The Register y The New Stack
Apenas ha pasado una semana, así que hay que darle tiempo a Google para que lo procese bien
Google tiende a favorecer a los sitios que cubrieron primero un tema
Por eso, es muy probable que el ranking se ajuste con el tiempo
Mientras tanto, sería mejor enlazar al sitio oficial en lugar de GitHub
Revisándolo directamente, solo The Register citó la página incorrecta; los otros artículos estaban referenciando GitHub
Archivo de The Register
Archivo de VentureBeat
Archivo de The New Stack
Esto muestra que, con tanto contenido duplicado en internet, el criterio de “el que publicó primero es el original” no siempre funciona
Por eso todavía al buscar aparecen arriba los docs de Java 8. Es algo bastante irritante
El punto clave del problema es que “apenas ha pasado una semana”
El algoritmo de Google está enredado con muchísimos pesos de authority y quality, así que no es fácil cambiarlo en poco tiempo
Si eres desarrollador, conviene crear una página web propia para cada proyecto
Si es posible, también es más seguro hacer self-hosting del repo
Soy usuario de pago de Kagi, pero últimamente también me ha decepcionado porque Kagi está mostrando muchos resultados de baja calidad generados por IA
Los resultados de búsqueda para nanoclaw eran casi iguales a los de Google
Yo siento algo parecido
Las funciones de personalización de Kagi están buenas, pero la web en sí ya está tan llena de información de baja calidad que al final cualquier buscador tiene límites
Últimamente ningún motor de búsqueda me convence :(
Probé buscar nanoclaw en Kagi y salió así
en 1.º nanoclaw[dot]net,
en 2.º el repo de GitHub de qwibitai (parece falso),
en 3.º un video promocional,
en 4.º el GitHub de gavrielc, que sí parece real,
en 5.º nanoclaw.dev, pero con el título “Don’t trust AI agents”
en 6.º otro fork
Hice un resumen tras probar varios buscadores y AIs
Google y Brave muestran primero el GitHub oficial → luego el dominio falso,
DuckDuckGo y Bing muestran primero el dominio falso → luego el GitHub oficial,
Mojeek estaba centrado en artículos de terceros y Qwant fue el peor
En cambio, los modos de búsqueda con IA como ChatGPT, Gemini y Grok en su mayoría identificaron correctamente el sitio oficial, y algunos incluso mostraron advertencias sobre el sitio falso
En conclusión, la IA fue mucho más precisa que la búsqueda tradicional
Pero los resultados cambian según el usuario
En mi Google aparece .net en 1.º y GitHub en 2.º
El modo ChatGPT 5.2 Auto todavía confundió .net con el sitio oficial, pero el modo Thinking y Claude sí priorizaron correctamente .dev
AltPower Search mostró el mismo problema
Parece que nanoclaw.dev todavía es un dominio nuevo y aún no está bien indexado
Consulten AltPower, Archive y Cloudflare Radar
Me da curiosidad qué prompt usaron para probar las AIs
El consejo sobre datos estructurados del comentario de arriba es clave
A mí también me pasó que, al agregar schema de Organization y SoftwareApplication, Google empezó a interpretar el sitio de una forma totalmente distinta
El problema es que Google, aun teniendo ya todas las señales, sigue dando más peso a la edad del dominio y la cantidad de backlinks
Al final, el sistema recompensa a quien apartó el dominio antes que al verdadero creador
Me pregunto si hay alguna forma de confirmar quién es una persona real
Hoy, al buscar nanoclaw, encontré otro sitio falso: nanoclawS.io
Está recolectando correos, así que es peligroso
En estos casos, más que pelear por el ranking en Google, creo que sería mejor bloquear el sitio a nivel de hosting
Si hay elementos con copyright que permitan hacer una solicitud DMCA, valdría la pena intentarlo
Mi consejo para todos los desarrolladores open source es que, cuando publiquen un proyecto, siempre contemplen la posibilidad de que sea abusado
Así es como funciona el mundo
Se agradece el open source, pero primero hay que protegerse a uno mismo
Sobre todo si usas licencia MIT, una empresa grande como Amazon podría hacer un fork y ganar dinero con eso, y tú podrías no recibir ni un centavo
Es un problema de otra escala, distinto al de programar por caridad
Una ley relacionada es Hyrum’s Law
Dice: “Con una cantidad suficiente de usuarios de una API, todos los comportamientos observables de tu sistema terminarán siendo una dependencia para alguien”
Perder en SEO se parece a perder dinero en la bolsa
El sistema es tan eficiente y frío que no reacciona en absoluto a la frustración individual
Al final hay que replantear la estrategia y abordarlo desde entender cómo funciona el mercado
Como propuesta para @Gavriel, valdría la pena considerar registrar la marca NanoClaw
Solo con registrarla o incluso iniciar el trámite, ya aumenta mucho la capacidad de respuesta legal frente al registrante del dominio, Cloudflare o Google
También sería más fácil demostrar mala fe del otro lado en una disputa UDRP
Subirse a la tendencia de Claw estaba de moda, y ahora el giro es que alguien más se subió usando tu nombre
Es irónico si se piensa que el proyecto Claw original también se subió a la popularidad de otro producto antes de cambiar de nombre
Yo pensé lo mismo
Esto no parece tanto “un sitio honesto perjudicado por estafadores”, sino más bien un caso de alguien perdido dentro del juego infinito por la atención