Wikipedia deja de usar Archive.today y comienza a eliminar 695 mil enlaces

(arstechnica.com)

2 puntos por GN⁺ 2026-02-22 | 1 comentarios | Compartir por WhatsApp

La Wikipedia en inglés agregó el sitio Archive.today a la lista negra y comenzó a eliminar sus enlaces
Se confirmó que el sitio indujo ataques DDoS contra blogs y manipuló capturas de páginas web
Los editores de Wikipedia acordaron dejar de usarlo por el daño a la confiabilidad del sitio y el riesgo de abuso de los dispositivos de los usuarios
Hay aproximadamente 695 mil enlaces en 400 mil artículos, y se considera que la mayoría puede reemplazarse por otros servicios de archivo
Se recomendó a los editores reemplazarlos por Internet Archive, Ghostarchive, Megalodon u otros, o eliminarlos

Decisión de Wikipedia de bloquear Archive.today

La Wikipedia en inglés decidió agregar Archive.today a la lista negra
- La razón de la decisión es que el sitio fue utilizado para ataques DDoS contra blogs
- Durante la discusión en Wikipedia, se descubrió un caso en el que el sitio manipuló una captura de una página web para insertar el nombre del bloguero atacado
Los editores de Wikipedia concluyeron que la manipulación fue una represalia por una publicación de blog sobre cómo el operador del sitio ocultaba su identidad usando varios seudónimos

Consenso de la comunidad de Wikipedia

Según la actualización oficial de Wikipedia, se decidió deprecar de inmediato Archive.today y agregarlo a la lista negra de spam o bloquearlo mediante filtros de edición
- Además, se decidió eliminar todos los enlaces existentes
La comunidad citó como fundamento la política (WP:ELNO#3): “no se debe dirigir a los lectores a un sitio que secuestra las computadoras de los usuarios para ejecutar ataques DDoS”
Se presentó evidencia de que el contenido de páginas archivadas fue manipulado, por lo que se consideró dañada la confiabilidad del sitio

Escala de los enlaces y posibilidad de reemplazo

Los enlaces de Archive.today aparecen en más de 695 mil casos dentro de unos 400 mil artículos
El sitio se había usado con frecuencia para eludir paywalls de noticias
Aunque hubo opiniones a favor de mantener la situación actual, el análisis confirmó que la mayoría de los enlaces puede sustituirse por otros archivos
Algunos editores comenzaron a definir en detalle el proceso para eliminar y reemplazar enlaces

Guía para los editores

El documento recién publicado Wikipedia:Archive.today_guidance orienta a los editores sobre cómo eliminar y reemplazar enlaces
- Los dominios objetivo incluyen archive.today, archive.is, archive.ph, archive.fo, archive.li, archive.md, archive.vn y otros
Si la fuente original sigue en línea y el contenido es el mismo, se puede eliminar el enlace de Archive.today
También puede reemplazarse por otros servicios de archivo como Internet Archive, Ghostarchive o Megalodon
Si el original existe en formato impreso o si el enlace era solo por conveniencia, puede eliminarse el enlace de archivo por completo

Medidas para reforzar la confiabilidad y la seguridad en Wikipedia

Esta medida se considera un paso para reforzar la confiabilidad de Wikipedia y la protección de los usuarios
La comunidad la ve como una oportunidad para establecer criterios claros de respuesta ante manipulaciones del sitio y conductas maliciosas
Más adelante se seguirá discutiendo cómo avanzar de forma eficiente con la eliminación de enlaces

1 comentarios

GN⁺ 2026-02-22

Comentarios de Hacker News

Vi hace poco un artículo sobre una posible campaña organizada contra archive.today
Me interesa saber si hay material que explique con más profundidad cómo funciona realmente la arquitectura técnica de archive.today. Necesito algo más que simples resultados de búsqueda con IA o un hilo anterior de HN
- Si de verdad están siendo blanco de una campaña organizada de difamación, entonces hacer DDoS contra el blog de otra persona o modificar páginas archivadas no les ayuda en nada
- archive.today me funciona bastante bien. Muchas veces logra archivar cuando archive.org falla
  Como archive.org sí atiende solicitudes de eliminación, me pregunto si atacan a archive.today porque preserva contenido que se niega a borrar
- También hubo noticias recientes de varios sitios que empezaron a bloquear a Internet Archive. Se siente como la siguiente etapa de la guerra de la información
- Ese artículo suena como si lo hubiera escrito una IA. Está armado en torno a resúmenes y no tiene información del autor. Mi detector de IA se dispara
No creo que tenga sentido doxxear a alguien. Mucho menos si es alguien que presta un servicio útil para usuarios comunes
Pero sí me parece problemático que archive.today convierta a sus usuarios en una botnet para lanzar ataques DDoS, o que altere el contenido de páginas archivadas.
Ese tipo de cosas hacen que el sitio parezca infectado con malware y reducen la confiabilidad del contenido archivado. Entiendo por qué Wikipedia lo bloqueó
- Antes, doxxing significaba hacer pública información privada. Pero ahora llamar doxxing a solo recopilar información pública ya es exagerado
  Si la investigación se hizo solo con información pública, no lo vería como algo antiético
- Irónicamente, es interesante que un sitio que presume de preservación permanente quiera bajar artículos donde se le menciona. Es una situación tipo “vive por la espada, muere por la espada”
- Este tipo de problema quizá podría resolverse con un sistema distribuido de verificación basado en blockchain. Podría gestionar el historial de cambios sin perder el original
- Los sitios de archivo web muchas veces tienen que modificar un poco el HTML. Cambios para mejorar la usabilidad, como reescribir rutas de enlaces, son naturales
  El problema es que en el caso de archive.today esos cambios parecen manipulaciones intencionales
- La autenticidad de la página archivada es el punto central. De aquí en adelante, ese debería ser el foco de la discusión
Encontré algunas capturas de X/Twitter en archive.today que se guardaron mientras la sesión estaba iniciada en la cuenta “advancedhosters”
Esa cuenta está vinculada a una empresa de web hosting en Chipre y hace poco enlazó una publicación que filtró correos privados entre el operador de archive.today (que usa el alias “Volth”) y el dueño del sitio
Una publicación anterior era un enlace archivado en archive.today a un artículo prorruso y antiucraniano. Parece una pista interesante
- Esa cuenta podría ser una cuenta donada. Los sitios de la familia archive.today a veces usan cuentas de suscripción pagada para saltar paywalls
  Aun así, a diferencia de una entidad sin fines de lucro legal como Internet Archive, este tipo de operación es difícil de distinguir de una actividad delictiva
- Dicen que es una “pista interesante”, pero en realidad no está claro a qué podría llevar
El año pasado vi en archive.today un caso donde se modificaba una página archivada
Antes, las páginas archivadas de Reddit mostraban el nombre de usuario en la esquina superior derecha, pero en algún momento desapareció. El problema es que también hubo una modificación retroactiva en capturas antiguas
En la pestaña de screenshots el nombre seguía apareciendo, así que quedó una diferencia respecto al original. Al principio me pareció algo menor, pero viendo los incidentes recientes ya no parece tan trivial
- Pero eso podría haber sido una medida para evitar exponer una cuenta con sesión iniciada, más que algo malicioso.
  Si hubieran modificado el contenido de la publicación de Reddit, eso ya sería un problema completamente distinto, pero si era solo información de la cuenta, se puede entender
Mucha gente no lo sabe, pero Perma.cc es una herramienta oficial de archivado adecuada para usarse en lugares como Wikipedia
Hay más detalles en el artículo de Wikipedia
- Eso sí, después de 10 enlaces hace falta una suscripción de pago o una cuenta institucional. No encaja bien con una enciclopedia que cualquiera puede editar
- Creo que sería mejor que Wikipedia construyera esto por su cuenta. Ya opera su propio CDN, así que parece factible. Aunque saltar paywalls sí sería riesgoso
- Yo también me cambié a Perma.cc esta semana, pero da errores con páginas con muchas imágenes y directamente bloquea Reddit. Aun así, como es open source, hay margen de mejora
Me pregunto si habrá algún servidor de archivo autohospedado que se pueda usar de forma personal
Parece que ArchiveBox es el más conocido, y planeo probarlo. Aunque seguramente será incómodo porque no tiene función de reescritura de URL
Estaría bien que tuviera una función para enlazar automáticamente varias páginas de un mismo artículo
- Yo prefiero Readeck. Es open source y también tiene apps para iOS y Android
  Con la función Content Scripts puedes escribir tus propios scripts de transformación de URL
- Otra alternativa es Omnom. Su repositorio en GitHub también está público
Según el artículo de Ars Technica, Wikipedia bloqueó a archive.today por ataques DDoS y manipulación de contenido
Personalmente, casi no uso archive.today porque me resulta incómodo. Pero en HN parece usarse mucho para saltar paywalls
El problema es el historial previo y el anonimato de su operador. Está en una posición desde la que puede recopilar muchos datos sobre los hábitos de lectura de los usuarios de HN
- Yo uso archive.today seguido. Por ejemplo, no tengo otra alternativa cuando quiero leer artículos con paywall de The Economist
- Si bloquean el dominio .today, basta con cambiar a otro TLD como archive.ph, archive.is, archive.md
- No tiene mucho sentido debatir un artículo sin leerlo, así que saltar paywalls también es necesario para la calidad de las discusiones en HN
- “archive.today” en realidad es un nombre genérico para varios dominios archive.tld. Cuando dicen que se “promociona” en HN, simplemente quieren decir que se comparte mucho en enlaces
- Muchos usuarios simplemente usan archive.today con el objetivo de hacer que todos puedan leer
Curiosamente, esta no es la primera vez que archive.today se ve involucrado en un DDoS
Según una publicación de HN de hace 3 años, hubo un caso en archive.ph donde se ejecutó un ataque DDoS con código XmlHttpRequest
En ese momento el objetivo era northcountrygazette.org, y el sitio se volvió tan lento que parece que el ataque realmente surtió efecto
Ese sitio había amenazado antes con rastrear a quienes saltaran el paywall y usaba un robots.txt que bloqueaba el archivado. Al parecer terminó cerrando
Me pregunto si sería posible crear localmente un archivo web irreversible sin depender de sitios de terceros
Pienso si no se podría registrar toda la transacción TLS para revalidarla más adelante. Claro, si se filtra el certificado, existiría el riesgo de falsificación
- Como mínimo, si un sitio de archivo publicara el hash del contenido, luego se podría verificar si hubo alteraciones
  Técnicamente, Wayback Machine tampoco es muy superior a archive.today en ese aspecto
- Pero verificar reproduciendo una sesión TLS es imposible. En cambio, un sistema público de logs de transparencia podría ser una alternativa, aunque sería difícil que fuera perfecto por la naturaleza dinámica de la web
Hay varias soluciones de archivo autohospedadas, pero su nivel de madurez es muy disparejo
Uno pensaría que ya existiría una implementación estándar que sirviera tanto para uso personal como público, pero parece que todavía no
- Pienso lo mismo. En lo personal, me gustaría que hubiera una alternativa simple que uno pudiera usar por su cuenta

Wikipedia deja de usar Archive.today y comienza a eliminar 695 mil enlaces

Decisión de Wikipedia de bloquear Archive.today

Consenso de la comunidad de Wikipedia

Escala de los enlaces y posibilidad de reemplazo

Guía para los editores

Medidas para reforzar la confiabilidad y la seguridad en Wikipedia

Lecturas relacionadas

1 comentarios

Comentarios de Hacker News