2 puntos por GN⁺ 2026-02-22 | 1 comentarios | Compartir por WhatsApp
  • La Wikipedia en inglés agregó el sitio Archive.today a la lista negra y comenzó a eliminar sus enlaces
  • Se confirmó que el sitio indujo ataques DDoS contra blogs y manipuló capturas de páginas web
  • Los editores de Wikipedia acordaron dejar de usarlo por el daño a la confiabilidad del sitio y el riesgo de abuso de los dispositivos de los usuarios
  • Hay aproximadamente 695 mil enlaces en 400 mil artículos, y se considera que la mayoría puede reemplazarse por otros servicios de archivo
  • Se recomendó a los editores reemplazarlos por Internet Archive, Ghostarchive, Megalodon u otros, o eliminarlos

Decisión de Wikipedia de bloquear Archive.today

  • La Wikipedia en inglés decidió agregar Archive.today a la lista negra
    • La razón de la decisión es que el sitio fue utilizado para ataques DDoS contra blogs
    • Durante la discusión en Wikipedia, se descubrió un caso en el que el sitio manipuló una captura de una página web para insertar el nombre del bloguero atacado
  • Los editores de Wikipedia concluyeron que la manipulación fue una represalia por una publicación de blog sobre cómo el operador del sitio ocultaba su identidad usando varios seudónimos

Consenso de la comunidad de Wikipedia

  • Según la actualización oficial de Wikipedia, se decidió deprecar de inmediato Archive.today y agregarlo a la lista negra de spam o bloquearlo mediante filtros de edición
    • Además, se decidió eliminar todos los enlaces existentes
  • La comunidad citó como fundamento la política (WP:ELNO#3): “no se debe dirigir a los lectores a un sitio que secuestra las computadoras de los usuarios para ejecutar ataques DDoS
  • Se presentó evidencia de que el contenido de páginas archivadas fue manipulado, por lo que se consideró dañada la confiabilidad del sitio

Escala de los enlaces y posibilidad de reemplazo

  • Los enlaces de Archive.today aparecen en más de 695 mil casos dentro de unos 400 mil artículos
  • El sitio se había usado con frecuencia para eludir paywalls de noticias
  • Aunque hubo opiniones a favor de mantener la situación actual, el análisis confirmó que la mayoría de los enlaces puede sustituirse por otros archivos
  • Algunos editores comenzaron a definir en detalle el proceso para eliminar y reemplazar enlaces

Guía para los editores

  • El documento recién publicado Wikipedia:Archive.today_guidance orienta a los editores sobre cómo eliminar y reemplazar enlaces
    • Los dominios objetivo incluyen archive.today, archive.is, archive.ph, archive.fo, archive.li, archive.md, archive.vn y otros
  • Si la fuente original sigue en línea y el contenido es el mismo, se puede eliminar el enlace de Archive.today
  • También puede reemplazarse por otros servicios de archivo como Internet Archive, Ghostarchive o Megalodon
  • Si el original existe en formato impreso o si el enlace era solo por conveniencia, puede eliminarse el enlace de archivo por completo

Medidas para reforzar la confiabilidad y la seguridad en Wikipedia

  • Esta medida se considera un paso para reforzar la confiabilidad de Wikipedia y la protección de los usuarios
  • La comunidad la ve como una oportunidad para establecer criterios claros de respuesta ante manipulaciones del sitio y conductas maliciosas
  • Más adelante se seguirá discutiendo cómo avanzar de forma eficiente con la eliminación de enlaces

1 comentarios

 
GN⁺ 2026-02-22
Comentarios de Hacker News
  • Vi hace poco un artículo sobre una posible campaña organizada contra archive.today
    Me interesa saber si hay material que explique con más profundidad cómo funciona realmente la arquitectura técnica de archive.today. Necesito algo más que simples resultados de búsqueda con IA o un hilo anterior de HN

    • Si de verdad están siendo blanco de una campaña organizada de difamación, entonces hacer DDoS contra el blog de otra persona o modificar páginas archivadas no les ayuda en nada
    • archive.today me funciona bastante bien. Muchas veces logra archivar cuando archive.org falla
      Como archive.org sí atiende solicitudes de eliminación, me pregunto si atacan a archive.today porque preserva contenido que se niega a borrar
    • También hubo noticias recientes de varios sitios que empezaron a bloquear a Internet Archive. Se siente como la siguiente etapa de la guerra de la información
    • Ese artículo suena como si lo hubiera escrito una IA. Está armado en torno a resúmenes y no tiene información del autor. Mi detector de IA se dispara
  • No creo que tenga sentido doxxear a alguien. Mucho menos si es alguien que presta un servicio útil para usuarios comunes
    Pero sí me parece problemático que archive.today convierta a sus usuarios en una botnet para lanzar ataques DDoS, o que altere el contenido de páginas archivadas.
    Ese tipo de cosas hacen que el sitio parezca infectado con malware y reducen la confiabilidad del contenido archivado. Entiendo por qué Wikipedia lo bloqueó

    • Antes, doxxing significaba hacer pública información privada. Pero ahora llamar doxxing a solo recopilar información pública ya es exagerado
      Si la investigación se hizo solo con información pública, no lo vería como algo antiético
    • Irónicamente, es interesante que un sitio que presume de preservación permanente quiera bajar artículos donde se le menciona. Es una situación tipo “vive por la espada, muere por la espada”
    • Este tipo de problema quizá podría resolverse con un sistema distribuido de verificación basado en blockchain. Podría gestionar el historial de cambios sin perder el original
    • Los sitios de archivo web muchas veces tienen que modificar un poco el HTML. Cambios para mejorar la usabilidad, como reescribir rutas de enlaces, son naturales
      El problema es que en el caso de archive.today esos cambios parecen manipulaciones intencionales
    • La autenticidad de la página archivada es el punto central. De aquí en adelante, ese debería ser el foco de la discusión
  • Encontré algunas capturas de X/Twitter en archive.today que se guardaron mientras la sesión estaba iniciada en la cuenta “advancedhosters”
    Esa cuenta está vinculada a una empresa de web hosting en Chipre y hace poco enlazó una publicación que filtró correos privados entre el operador de archive.today (que usa el alias “Volth”) y el dueño del sitio
    Una publicación anterior era un enlace archivado en archive.today a un artículo prorruso y antiucraniano. Parece una pista interesante

    • Esa cuenta podría ser una cuenta donada. Los sitios de la familia archive.today a veces usan cuentas de suscripción pagada para saltar paywalls
      Aun así, a diferencia de una entidad sin fines de lucro legal como Internet Archive, este tipo de operación es difícil de distinguir de una actividad delictiva
    • Dicen que es una “pista interesante”, pero en realidad no está claro a qué podría llevar
  • El año pasado vi en archive.today un caso donde se modificaba una página archivada
    Antes, las páginas archivadas de Reddit mostraban el nombre de usuario en la esquina superior derecha, pero en algún momento desapareció. El problema es que también hubo una modificación retroactiva en capturas antiguas
    En la pestaña de screenshots el nombre seguía apareciendo, así que quedó una diferencia respecto al original. Al principio me pareció algo menor, pero viendo los incidentes recientes ya no parece tan trivial

    • Pero eso podría haber sido una medida para evitar exponer una cuenta con sesión iniciada, más que algo malicioso.
      Si hubieran modificado el contenido de la publicación de Reddit, eso ya sería un problema completamente distinto, pero si era solo información de la cuenta, se puede entender
  • Mucha gente no lo sabe, pero Perma.cc es una herramienta oficial de archivado adecuada para usarse en lugares como Wikipedia
    Hay más detalles en el artículo de Wikipedia

    • Eso sí, después de 10 enlaces hace falta una suscripción de pago o una cuenta institucional. No encaja bien con una enciclopedia que cualquiera puede editar
    • Creo que sería mejor que Wikipedia construyera esto por su cuenta. Ya opera su propio CDN, así que parece factible. Aunque saltar paywalls sí sería riesgoso
    • Yo también me cambié a Perma.cc esta semana, pero da errores con páginas con muchas imágenes y directamente bloquea Reddit. Aun así, como es open source, hay margen de mejora
  • Me pregunto si habrá algún servidor de archivo autohospedado que se pueda usar de forma personal
    Parece que ArchiveBox es el más conocido, y planeo probarlo. Aunque seguramente será incómodo porque no tiene función de reescritura de URL
    Estaría bien que tuviera una función para enlazar automáticamente varias páginas de un mismo artículo

    • Yo prefiero Readeck. Es open source y también tiene apps para iOS y Android
      Con la función Content Scripts puedes escribir tus propios scripts de transformación de URL
    • Otra alternativa es Omnom. Su repositorio en GitHub también está público
  • Según el artículo de Ars Technica, Wikipedia bloqueó a archive.today por ataques DDoS y manipulación de contenido
    Personalmente, casi no uso archive.today porque me resulta incómodo. Pero en HN parece usarse mucho para saltar paywalls
    El problema es el historial previo y el anonimato de su operador. Está en una posición desde la que puede recopilar muchos datos sobre los hábitos de lectura de los usuarios de HN

    • Yo uso archive.today seguido. Por ejemplo, no tengo otra alternativa cuando quiero leer artículos con paywall de The Economist
    • Si bloquean el dominio .today, basta con cambiar a otro TLD como archive.ph, archive.is, archive.md
    • No tiene mucho sentido debatir un artículo sin leerlo, así que saltar paywalls también es necesario para la calidad de las discusiones en HN
    • “archive.today” en realidad es un nombre genérico para varios dominios archive.tld. Cuando dicen que se “promociona” en HN, simplemente quieren decir que se comparte mucho en enlaces
    • Muchos usuarios simplemente usan archive.today con el objetivo de hacer que todos puedan leer
  • Curiosamente, esta no es la primera vez que archive.today se ve involucrado en un DDoS
    Según una publicación de HN de hace 3 años, hubo un caso en archive.ph donde se ejecutó un ataque DDoS con código XmlHttpRequest
    En ese momento el objetivo era northcountrygazette.org, y el sitio se volvió tan lento que parece que el ataque realmente surtió efecto
    Ese sitio había amenazado antes con rastrear a quienes saltaran el paywall y usaba un robots.txt que bloqueaba el archivado. Al parecer terminó cerrando

  • Me pregunto si sería posible crear localmente un archivo web irreversible sin depender de sitios de terceros
    Pienso si no se podría registrar toda la transacción TLS para revalidarla más adelante. Claro, si se filtra el certificado, existiría el riesgo de falsificación

    • Como mínimo, si un sitio de archivo publicara el hash del contenido, luego se podría verificar si hubo alteraciones
      Técnicamente, Wayback Machine tampoco es muy superior a archive.today en ese aspecto
    • Pero verificar reproduciendo una sesión TLS es imposible. En cambio, un sistema público de logs de transparencia podría ser una alternativa, aunque sería difícil que fuera perfecto por la naturaleza dinámica de la web
  • Hay varias soluciones de archivo autohospedadas, pero su nivel de madurez es muy disparejo
    Uno pensaría que ya existiría una implementación estándar que sirviera tanto para uso personal como público, pero parece que todavía no

    • Pienso lo mismo. En lo personal, me gustaría que hubiera una alternativa simple que uno pudiera usar por su cuenta