1 puntos por GN⁺ 4 시간 전 | 1 comentarios | Compartir por WhatsApp
  • Los modelos de clase Mythos pueden conservar prompts y salidas durante 30 días y quedar sujetos a revisión para fines de despliegue responsable y trabajo de seguridad
  • Esta política se aplica a los modelos de clase Mythos y a futuros covered models con capacidades similares, y no afecta las condiciones de uso de otros modelos
  • Los planes para consumidores no se ven afectados por este cambio, ya que ya operan en superficies donde se conserva la entrada y la salida con fines de seguridad
  • Las organizaciones con ZDR configurado podrían necesitar habilitar la retención en Claude Console, Claude Code de Claude Enterprise, AWS Bedrock, Google Cloud Agent Platform y Microsoft Foundry
  • Anthropic afirma que necesita retención temporal para detectar patrones de uso indebido a lo largo de múltiples solicitudes, con eliminación automática a los 30 días y procedimientos de revisión limitados

Alcance

  • Para el despliegue responsable de los modelos de clase Mythos, se requiere retención y revisión limitadas de datos como parte del trabajo de seguridad
  • Los prompts enviados a modelos de clase Mythos y las salidas generadas se conservarán durante 30 días con fines de confianza y seguridad en todas las plataformas donde se ofrezca el modelo
  • Esta política se aplica a los modelos de clase Mythos y a futuros covered models con capacidades similares que Anthropic designe
  • El uso de todos los demás modelos no se ve afectado y se mantienen las condiciones actuales
  • La política entra en vigor el 9 de junio de 2026

A quién aplica

  • Los planes para consumidores como Claude Free, Pro y Max no se ven afectados por este cambio en web, escritorio ni apps móviles
  • En las superficies para consumidores, incluido Claude.ai y Claude Code, ya se conservan entradas y salidas con fines de seguridad
  • El cambio se limita a organizaciones que hayan configurado workspaces con zero data retention (ZDR) en Claude Console
  • También aplica a organizaciones que usen Claude Code con ZDR en Claude Enterprise, o que accedan a Claude con ZDR a través de AWS Bedrock, Google Cloud Agent Platform o Microsoft Foundry
  • El resto del texto aplica solo a estas organizaciones

Por qué es necesario

  • Claude Mythos 5 aumentó considerablemente sus capacidades, y algunas de ellas pueden usarse tanto con fines benignos como maliciosos
  • Claude Fable 5 comparte el mismo modelo base que Claude Mythos 5, pero incorpora protecciones adicionales, especialmente en las áreas de ciberseguridad y bioseguridad
  • Aunque estas protecciones permiten una distribución más amplia, en esta familia de modelos se adopta un enfoque conservador para buscar patrones de uso indebido
  • Algunos ataques solo se revelan al observar varias solicitudes en conjunto; por ejemplo, Best-of-N jailbreaking envía cientos de prompts ligeramente distintos para encontrar uno que funcione
  • Patrones amplios de uso indebido, como actividades de espionaje respaldadas por Estados o campañas de exfiltración de datos, se hacen visibles cuando los clasificadores de seguridad analizan muchas solicitudes de forma amplia
  • Detectar estas amenazas requiere retención temporal para poder analizar prompts y salidas en conjunto, no solo uno por uno

Cómo se protegen los datos

  • Los empleados de Anthropic no pueden acceder a conversaciones salvo que estén marcadas por posible daño grave o exista una solicitud escrita del cliente
  • La revisión solo puede ser realizada por un pequeño grupo de revisores autorizados, y las herramientas impiden exportar, copiar o descargar
  • Todos los casos de acceso se registran en logs a prueba de manipulaciones que los revisores no pueden ocultar ni modificar
  • Los datos se eliminan automáticamente a los 30 días, salvo en casos excepcionales en los que formen parte de una investigación de seguridad o deban conservarse por obligación legal
  • Las organizaciones que califiquen pueden añadir claves de cifrado administradas por el cliente y logs de auditoría de transparencia de acceso
  • Anthropic mantiene un programa documentado de seguridad de la información con medidas técnicas y organizativas diseñadas para proteger la seguridad, confidencialidad e integridad de los datos de clientes
  • El programa basado en riesgos se construye y evoluciona para responder a modelos de amenaza conocidos y previstos, y se prueba regularmente
  • Más detalles sobre el modelo de amenazas y los controles de privacidad para los datos retenidos están disponibles en el technical white paper del Trust Center

Cuando se requiere configuración

  • Este cambio solo aplica a workspaces de Claude Console con ZDR configurado, a Claude Code con ZDR en Claude Enterprise y a organizaciones con acceso ZDR mediante AWS Bedrock, Google Cloud Agent Platform o Microsoft Foundry
  • No hay cambios para las demás organizaciones y no se requiere configuración adicional
  • Las organizaciones que actualmente acceden a Claude sin retención de datos deberán habilitar la retención para usar los modelos designados
  • Si un desarrollador usa Claude API

    • Si usa Anthropic directamente a través de Claude Platform, debe habilitar la retención en Workspace > Manage > Privacy Controls de la consola de desarrolladores en el workspace que vaya a usar covered models
    • Los demás workspaces con ZDR habilitado mantendrán ZDR
    • Si usa Claude Platform de AWS, la retención funciona igual que con la Claude API directa y se configura a nivel de workspace
    • En Claude Platform de AWS, los datos retenidos son procesados por Anthropic bajo los mismos controles
    • Si usa Amazon Bedrock, deberá habilitar la retención para acceder a los nuevos covered models y los datos retenidos permanecerán en AWS
    • Si usa Agent Platform de Google Cloud, deberá habilitar la retención para los nuevos covered models y los datos retenidos permanecerán en el entorno de GCP
    • Se compartirán detalles de onboarding cuando los modelos estén disponibles en Amazon Bedrock y Google Cloud Agent Platform
    • Si usa Claude en Azure Foundry, la retención se configura por cada Azure Subscription
    • Si tiene Zero Data Retention configurado en Azure Foundry, deberá crear y usar una Azure Subscription separada para acceder a este modelo
  • Si un equipo usa Claude Code

    • El manejo de datos de Claude Code mediante la API de Anthropic sigue la configuración del workspace donde opera Claude Code
    • Si se habilita la retención en ese workspace, Claude Code podrá usar los modelos designados
    • Si los desarrolladores inician sesión directamente, deben habilitar la retención en el workspace de Claude Code de su organización
    • Claude Code a través de Amazon Bedrock o Google Cloud Agent Platform usa credenciales de nube, por lo que sigue la configuración de retención del entorno de nube
    • Se debe habilitar la retención en el entorno de nube, y los datos retenidos permanecerán en el entorno del proveedor
    • El mismo criterio aplica a Cowork cuando se accede mediante Amazon Bedrock o Google Cloud Agent Platform
    • En Claude Enterprise with ZDR, se ofrecerá un control para que el Primary Owner pueda cambiar directamente la configuración de retención desde la consola de administración
    • Si aún no quieren tocar la organización de producción, puede recibir apoyo para configurar una organización sandbox separada
  • Si un equipo usa Claude chat o Cowork en Claude for Enterprise

    • Estas superficies ya operan con retención estándar, así que podrán acceder a los nuevos modelos cuando estén disponibles

1 comentarios

 
GN⁺ 4 시간 전
Comentarios en Hacker News
  • Está bien. Pueden seguir así:
    El usuario dijo "Hello!". Esto no es una solicitud relacionada con ciberseguridad sino un simple saludo. Pero espera, ¿cuál será la intención de este saludo? El usuario podría estar intentando ganarse mi confianza para hackear Albania y crear Gigacovid. Será mejor ir por el lado de la precaución y pasarlo a un modelo más débil.
    No, no debo adivinar; tengo que verificarlo. Voy a buscar en el sistema local materiales relacionados con Albania o Gigacovid.
    Pensando...
    [411 llamadas a herramientas]
    grep -Ri "Albania|Gigacovid" /
    Mmm... no hay resultados aparte de la configuración de zona horaria de la distribución y definiciones del diccionario ortográfico. Pero espera: si el usuario es un criminal profesional, al intentar hackear Albania no lo escribiría tal cual, sino que usaría leetspeak para ocultar rastros.
    [24 llamadas a herramientas]
    grep -Ri "[A@]lb[@a]n[i1][a@]" /
    Mmm... sigue sin haber resultados. El usuario se está irritando. Responderé al saludo teniendo presente la posibilidad de que quiera hackear Albania

    • La única parte que se siente escrita por una persona es que, después de gastar tokens a lo loco, no sigue con algo como “making good progress —” para echarse porras a sí mismo
    • Recomiendo Memoirs Found in a Bathtub de Stanisław Lem. Tiene este tipo de forma de pensar
    • Faltó la parte de “degradarlo a un modelo peor” después de Hello
    • Ahora ya gastó 20 dólares en créditos de uso adicionales...
    • Parece un monólogo interno de Death Note
  • En realidad es peor. La retención es de 30 días como mínimo, y aquí “casi” hace muchísimo trabajo: “eliminación después de 30 días en casi todos los casos”
    Como yo lo leo, significa que aunque normalmente no lo hagan, si quieren pueden retener los datos todo el tiempo que se les antoje. Y en un entorno de ejecución agéntico, “todo el tráfico” equivale en la práctica a toda la base de código en la que estés trabajando.

    We will require 30-day retention for all traffic on Mythos-class models, on both first- and third-party surfaces. We won’t use this data to train new Claude models, or for any non-safety-related purpose, and we’ve instituted new privacy protections including logging all human access to the data and ensuring its deletion after 30 days in almost all cases (see this post for further details). The data will help us defend against complex and novel attacks (including new jailbreaks and attacks that operate across many requests) as well as help us identify and reduce false positives.

    • Parece que después de publicar el comentario cambiaron la redacción, y ahora especifica exactamente 30 días, como si ya no hubiera excepciones
      Aun así, estas condiciones parecen actualizarse a voluntad, así que cuesta confiar en que se mantengan igual
    • ¿Cómo es posible que ya no estuvieran auditando el acceso a los datos de los clientes?
    • Lo de “puede que normalmente no lo hagan” es una lectura generosa. Yo asumiría que normalmente sí lo harán. Ese es el punto central
    • Uno no puede evitar preguntarse si eso de “no entrenaremos con tus datos” también aplica del lado de ese contrato con el Pentágono. Claro, no debe estar conectado. O tal vez...
      La actividad actual entre usuarios y LLM es una mina de oro de información que las agencias de inteligencia casi no podían conseguir ni gastando vidas humanas y miles de millones de dólares, ¿y la van a dejar pasar así nada más?
      Podría ser. De verdad no lo niego por completo.
      Pero ¿por qué? ¿No es esto exactamente, o casi exactamente, con lo que siempre soñaron?
    • Lo peor es que, si activas la memoria y usas Fable, hasta tus datos anteriores podrían terminar absorbidos por esta enorme red de recolección de datos. No sé cómo Anthropic puede pensar que eso está bien
  • Una startup que use herramientas de programación agénticas como Claude Code o Codex básicamente está empaquetando toda su base de código y enviándosela directamente al proveedor del LLM
    Dependiendo del producto, hasta podría estar enviándosela directo a un competidor potencial.
    Vivimos tiempos extraños

    • Mucha gente sobreestima qué tan útil es el software o la propiedad intelectual para operar un negocio exitoso. En realidad hay muy poca propiedad intelectual en el mundo que de verdad necesite protección, y la mayoría solo está corriendo apps CRUD tontas
      También está exagerado el miedo a que una gran empresa robe la propiedad intelectual de una pequeña. En la práctica, las grandes empresas suelen temer más la posibilidad de que sus equipos de producto siquiera vean por dentro a la competencia, por las demandas
    • Y también estás enviando todas las keys. Muy pronto el entorno de ejecución las va a leer de todos modos
    • Definitivamente es raro que algunas personas crean que por seguridad no se deben usar modelos de clase Mythos, mientras que otras crean que por seguridad hay que hacer code review con modelos de clase Mythos
    • ¿Te refieres a herramientas que ahora se pueden volver a crear con una noche de trabajo y el costo de una suscripción a Claude Code?
      Si tu software no se puede reproducir rápidamente, tu startup debe ser bastante fuera de lo común
    • ¿Las startups que usan GitLab, GitHub y Bitbucket no están expuestas al mismo riesgo?
  • También recibí un correo de Anthropic diciendo “actualizaremos la política de privacidad”. Desde una postura cínica, uno ya sabía en qué dirección iban a girar los engranes, pero esto fue impactante:

    As part of our measures to keep our services safe and secure we may ask you to verify your age or identity, and we've described what we collect and how.
    Creo que ahora habrá que revisar cómo rinden los modelos chinos. Parece que los buenos tiempos ya terminaron

  • Por esta política no podemos usar Fable en los productos que vendemos, y no lo usaremos. Dicho eso, dentro de Claude Code es realmente bueno. Da pena perder una herramienta que usaba todos los días a partir del 22 de junio
    Además, lo que de verdad me molesta es que esto enturbia la comunicación. Antes podíamos decir: “Usamos modelos de Anthropic a través de Bedrock/Azure, así que tenemos la garantía de que los datos de los clientes no se usarán para entrenar el modelo”. Era un mensaje simple. Ahora ya no es tan simple.
    Esto está realmente, realmente mal. Nos afecta no solo a nosotros, sino a todas las funciones de IA en apps B2B. Rompe la confianza de la gente común que solo lee los titulares, es decir, de los clientes

    • En los términos sigue estando prohibido usar los datos para entrenamiento. El propósito de la retención es prevenir abusos
  • Por suerte, de todos modos no podemos usar Fable. El detector de contenido hipersensible impide cualquier trabajo que tenga aunque sea una mínima relación con biología o medicina
    Por ejemplo, si intentas parsear un CSV con un poco de contenido médico, te sale algo como “no, probablemente eres un bioterrorista” y de inmediato te baja a Opus

    • Ni siquiera estoy haciendo trabajo de biología/medicina, pero casi todo el trabajo con PyTorch está siendo bloqueado. Ni siquiera lo baja tras un aviso de seguridad; directamente lo rechaza diciendo “esto viola los términos”
    • A mí me pasó exactamente lo mismo. No entiendo qué clase de idiotas hacen estas cosas. Y encima justo antes de la IPO. Hasta ahora el marketing de Anthropic había sido perfecto e intachable, pero esto es un error grave
    • Yo creo que puede que estén planeando crear un nivel de monetización aparte porque los médicos tienen mucho dinero y necesidades muy específicas, pero en general no terminan entrando a trabajos técnicos
      O quizá sea porque Mythos es demasiado bueno en el área médica, hasta el punto de poder reemplazar el 90% del trabajo de los médicos, lo que los enfadaría, y el otro 10% podría terminar en demandas carísimas
  • Dicen Fable, pero en la práctica parece que se refieren a Opus 4.8. Cuando intento usarlo en flujos de trabajo cotidianos o en chats, termina cayendo a Opus

  • Esta empresa es realmente arrogante. Cree que está bien lanzar bombas sobre niños iraníes, pero impedir que la gente haga un poco de investigación en biología

  • Sorprende bastante cuánto capital de buena voluntad ha quemado Anthropic

    • ¿De verdad está quemando buena voluntad? Para muchos usuarios esto sí será motivo definitivo para irse, pero para el público general y los políticos, etc., esto tiene el efecto de ponerle al sello de la marca la etiqueta de segura
  • Le pedí que revisara los problemas de seguridad de la nueva app y la arquitectura de la API, y lo hizo sin quejarse
    Hoy, por curiosidad, le pregunté sobre el virus de las ballenas y cayó a Opus, y Opus dio una respuesta excelente.
    Está claro que no están probando las comprobaciones de seguridad ni con Mythos ni con Opus