Anthropic exige retención de datos por 30 días para Fable y Mythos
(support.claude.com)- Los modelos de clase Mythos pueden conservar prompts y salidas durante 30 días y quedar sujetos a revisión para fines de despliegue responsable y trabajo de seguridad
- Esta política se aplica a los modelos de clase Mythos y a futuros covered models con capacidades similares, y no afecta las condiciones de uso de otros modelos
- Los planes para consumidores no se ven afectados por este cambio, ya que ya operan en superficies donde se conserva la entrada y la salida con fines de seguridad
- Las organizaciones con ZDR configurado podrían necesitar habilitar la retención en Claude Console, Claude Code de Claude Enterprise, AWS Bedrock, Google Cloud Agent Platform y Microsoft Foundry
- Anthropic afirma que necesita retención temporal para detectar patrones de uso indebido a lo largo de múltiples solicitudes, con eliminación automática a los 30 días y procedimientos de revisión limitados
Alcance
- Para el despliegue responsable de los modelos de clase Mythos, se requiere retención y revisión limitadas de datos como parte del trabajo de seguridad
- Los prompts enviados a modelos de clase Mythos y las salidas generadas se conservarán durante 30 días con fines de confianza y seguridad en todas las plataformas donde se ofrezca el modelo
- Esta política se aplica a los modelos de clase Mythos y a futuros covered models con capacidades similares que Anthropic designe
- El uso de todos los demás modelos no se ve afectado y se mantienen las condiciones actuales
- La política entra en vigor el 9 de junio de 2026
A quién aplica
- Los planes para consumidores como Claude Free, Pro y Max no se ven afectados por este cambio en web, escritorio ni apps móviles
- En las superficies para consumidores, incluido Claude.ai y Claude Code, ya se conservan entradas y salidas con fines de seguridad
- El cambio se limita a organizaciones que hayan configurado workspaces con zero data retention (ZDR) en Claude Console
- También aplica a organizaciones que usen Claude Code con ZDR en Claude Enterprise, o que accedan a Claude con ZDR a través de AWS Bedrock, Google Cloud Agent Platform o Microsoft Foundry
- El resto del texto aplica solo a estas organizaciones
Por qué es necesario
- Claude Mythos 5 aumentó considerablemente sus capacidades, y algunas de ellas pueden usarse tanto con fines benignos como maliciosos
- Claude Fable 5 comparte el mismo modelo base que Claude Mythos 5, pero incorpora protecciones adicionales, especialmente en las áreas de ciberseguridad y bioseguridad
- Aunque estas protecciones permiten una distribución más amplia, en esta familia de modelos se adopta un enfoque conservador para buscar patrones de uso indebido
- Algunos ataques solo se revelan al observar varias solicitudes en conjunto; por ejemplo, Best-of-N jailbreaking envía cientos de prompts ligeramente distintos para encontrar uno que funcione
- Patrones amplios de uso indebido, como actividades de espionaje respaldadas por Estados o campañas de exfiltración de datos, se hacen visibles cuando los clasificadores de seguridad analizan muchas solicitudes de forma amplia
- Detectar estas amenazas requiere retención temporal para poder analizar prompts y salidas en conjunto, no solo uno por uno
Cómo se protegen los datos
- Los empleados de Anthropic no pueden acceder a conversaciones salvo que estén marcadas por posible daño grave o exista una solicitud escrita del cliente
- La revisión solo puede ser realizada por un pequeño grupo de revisores autorizados, y las herramientas impiden exportar, copiar o descargar
- Todos los casos de acceso se registran en logs a prueba de manipulaciones que los revisores no pueden ocultar ni modificar
- Los datos se eliminan automáticamente a los 30 días, salvo en casos excepcionales en los que formen parte de una investigación de seguridad o deban conservarse por obligación legal
- Las organizaciones que califiquen pueden añadir claves de cifrado administradas por el cliente y logs de auditoría de transparencia de acceso
- Anthropic mantiene un programa documentado de seguridad de la información con medidas técnicas y organizativas diseñadas para proteger la seguridad, confidencialidad e integridad de los datos de clientes
- El programa basado en riesgos se construye y evoluciona para responder a modelos de amenaza conocidos y previstos, y se prueba regularmente
- Más detalles sobre el modelo de amenazas y los controles de privacidad para los datos retenidos están disponibles en el technical white paper del Trust Center
Cuando se requiere configuración
- Este cambio solo aplica a workspaces de Claude Console con ZDR configurado, a Claude Code con ZDR en Claude Enterprise y a organizaciones con acceso ZDR mediante AWS Bedrock, Google Cloud Agent Platform o Microsoft Foundry
- No hay cambios para las demás organizaciones y no se requiere configuración adicional
- Las organizaciones que actualmente acceden a Claude sin retención de datos deberán habilitar la retención para usar los modelos designados
-
Si un desarrollador usa Claude API
- Si usa Anthropic directamente a través de Claude Platform, debe habilitar la retención en Workspace > Manage > Privacy Controls de la consola de desarrolladores en el workspace que vaya a usar covered models
- Los demás workspaces con ZDR habilitado mantendrán ZDR
- Si usa Claude Platform de AWS, la retención funciona igual que con la Claude API directa y se configura a nivel de workspace
- En Claude Platform de AWS, los datos retenidos son procesados por Anthropic bajo los mismos controles
- Si usa Amazon Bedrock, deberá habilitar la retención para acceder a los nuevos covered models y los datos retenidos permanecerán en AWS
- Si usa Agent Platform de Google Cloud, deberá habilitar la retención para los nuevos covered models y los datos retenidos permanecerán en el entorno de GCP
- Se compartirán detalles de onboarding cuando los modelos estén disponibles en Amazon Bedrock y Google Cloud Agent Platform
- Si usa Claude en Azure Foundry, la retención se configura por cada Azure Subscription
- Si tiene Zero Data Retention configurado en Azure Foundry, deberá crear y usar una Azure Subscription separada para acceder a este modelo
-
Si un equipo usa Claude Code
- El manejo de datos de Claude Code mediante la API de Anthropic sigue la configuración del workspace donde opera Claude Code
- Si se habilita la retención en ese workspace, Claude Code podrá usar los modelos designados
- Si los desarrolladores inician sesión directamente, deben habilitar la retención en el workspace de Claude Code de su organización
- Claude Code a través de Amazon Bedrock o Google Cloud Agent Platform usa credenciales de nube, por lo que sigue la configuración de retención del entorno de nube
- Se debe habilitar la retención en el entorno de nube, y los datos retenidos permanecerán en el entorno del proveedor
- El mismo criterio aplica a Cowork cuando se accede mediante Amazon Bedrock o Google Cloud Agent Platform
- En Claude Enterprise with ZDR, se ofrecerá un control para que el Primary Owner pueda cambiar directamente la configuración de retención desde la consola de administración
- Si aún no quieren tocar la organización de producción, puede recibir apoyo para configurar una organización sandbox separada
-
Si un equipo usa Claude chat o Cowork en Claude for Enterprise
- Estas superficies ya operan con retención estándar, así que podrán acceder a los nuevos modelos cuando estén disponibles
1 comentarios
Comentarios en Hacker News
Está bien. Pueden seguir así:
El usuario dijo "Hello!". Esto no es una solicitud relacionada con ciberseguridad sino un simple saludo. Pero espera, ¿cuál será la intención de este saludo? El usuario podría estar intentando ganarse mi confianza para hackear Albania y crear Gigacovid. Será mejor ir por el lado de la precaución y pasarlo a un modelo más débil.
No, no debo adivinar; tengo que verificarlo. Voy a buscar en el sistema local materiales relacionados con Albania o Gigacovid.
Pensando...
[411 llamadas a herramientas]
grep -Ri "Albania|Gigacovid" /Mmm... no hay resultados aparte de la configuración de zona horaria de la distribución y definiciones del diccionario ortográfico. Pero espera: si el usuario es un criminal profesional, al intentar hackear Albania no lo escribiría tal cual, sino que usaría leetspeak para ocultar rastros.
[24 llamadas a herramientas]
grep -Ri "[A@]lb[@a]n[i1][a@]" /Mmm... sigue sin haber resultados. El usuario se está irritando. Responderé al saludo teniendo presente la posibilidad de que quiera hackear Albania
En realidad es peor. La retención es de 30 días como mínimo, y aquí “casi” hace muchísimo trabajo: “eliminación después de 30 días en casi todos los casos”
Como yo lo leo, significa que aunque normalmente no lo hagan, si quieren pueden retener los datos todo el tiempo que se les antoje. Y en un entorno de ejecución agéntico, “todo el tráfico” equivale en la práctica a toda la base de código en la que estés trabajando.
Aun así, estas condiciones parecen actualizarse a voluntad, así que cuesta confiar en que se mantengan igual
La actividad actual entre usuarios y LLM es una mina de oro de información que las agencias de inteligencia casi no podían conseguir ni gastando vidas humanas y miles de millones de dólares, ¿y la van a dejar pasar así nada más?
Podría ser. De verdad no lo niego por completo.
Pero ¿por qué? ¿No es esto exactamente, o casi exactamente, con lo que siempre soñaron?
Una startup que use herramientas de programación agénticas como Claude Code o Codex básicamente está empaquetando toda su base de código y enviándosela directamente al proveedor del LLM
Dependiendo del producto, hasta podría estar enviándosela directo a un competidor potencial.
Vivimos tiempos extraños
También está exagerado el miedo a que una gran empresa robe la propiedad intelectual de una pequeña. En la práctica, las grandes empresas suelen temer más la posibilidad de que sus equipos de producto siquiera vean por dentro a la competencia, por las demandas
Si tu software no se puede reproducir rápidamente, tu startup debe ser bastante fuera de lo común
También recibí un correo de Anthropic diciendo “actualizaremos la política de privacidad”. Desde una postura cínica, uno ya sabía en qué dirección iban a girar los engranes, pero esto fue impactante:
Por esta política no podemos usar Fable en los productos que vendemos, y no lo usaremos. Dicho eso, dentro de Claude Code es realmente bueno. Da pena perder una herramienta que usaba todos los días a partir del 22 de junio
Además, lo que de verdad me molesta es que esto enturbia la comunicación. Antes podíamos decir: “Usamos modelos de Anthropic a través de Bedrock/Azure, así que tenemos la garantía de que los datos de los clientes no se usarán para entrenar el modelo”. Era un mensaje simple. Ahora ya no es tan simple.
Esto está realmente, realmente mal. Nos afecta no solo a nosotros, sino a todas las funciones de IA en apps B2B. Rompe la confianza de la gente común que solo lee los titulares, es decir, de los clientes
Por suerte, de todos modos no podemos usar Fable. El detector de contenido hipersensible impide cualquier trabajo que tenga aunque sea una mínima relación con biología o medicina
Por ejemplo, si intentas parsear un CSV con un poco de contenido médico, te sale algo como “no, probablemente eres un bioterrorista” y de inmediato te baja a Opus
O quizá sea porque Mythos es demasiado bueno en el área médica, hasta el punto de poder reemplazar el 90% del trabajo de los médicos, lo que los enfadaría, y el otro 10% podría terminar en demandas carísimas
Dicen Fable, pero en la práctica parece que se refieren a Opus 4.8. Cuando intento usarlo en flujos de trabajo cotidianos o en chats, termina cayendo a Opus
Esta empresa es realmente arrogante. Cree que está bien lanzar bombas sobre niños iraníes, pero impedir que la gente haga un poco de investigación en biología
https://www.theguardian.com/technology/2026/feb/14/us-milita...
Sorprende bastante cuánto capital de buena voluntad ha quemado Anthropic
Le pedí que revisara los problemas de seguridad de la nueva app y la arquitectura de la API, y lo hizo sin quejarse
Hoy, por curiosidad, le pregunté sobre el virus de las ballenas y cayó a Opus, y Opus dio una respuesta excelente.
Está claro que no están probando las comprobaciones de seguridad ni con Mythos ni con Opus