- Antes de la audiencia del Senado de EE. UU. sobre IA, Anthropic afirmó que la actividad relacionada con Alibaba fue el ataque de este tipo de mayor escala dirigido contra la empresa
- El método clave fue la destilación (distillation), en la que se entrena un modelo más débil con las salidas de uno más fuerte; Anthropic considera que esto podría permitir que China llegue más rápido a capacidades del nivel de Mythos Preview
- Entre el 22 de abril y el 5 de junio de 2026, se registraron más de 28.8 millones de interacciones con Claude, y se identificaron casi 25 mil cuentas fraudulentas
- Anthropic sostuvo que los operadores estaban vinculados con Alibaba y con el laboratorio de IA Alibaba Qwen; Alibaba no respondió de inmediato a la solicitud de comentarios de Reuters
- Anthropic apoya el intercambio de inteligencia sobre amenazas entre el gobierno de EE. UU. y las empresas privadas de IA, así como una respuesta conjunta, aunque en el mismo período también se impusieron restricciones de acceso a sus modelos Mythos y Fable
Acusación de extracción ilegal relacionada con Alibaba
- Anthropic afirmó en una carta enviada al Senado de EE. UU. que la empresa china de tecnología y comercio electrónico Alibaba extrajo ilegalmente capacidades de los modelos de IA Claude
- Según la carta revisada por Reuters, Anthropic consideró esta actividad como el ataque de este tipo de mayor escala que ha identificado
- Alibaba no respondió de inmediato a la solicitud de comentarios de Reuters
Método de destilación y escala del ataque
- Anthropic calificó esta actividad como un intento de destilación (distillation)
- La destilación consiste en entrenar un modelo relativamente menos potente con las salidas de un modelo más poderoso
- El período de la campaña fue del 22 de abril al 5 de junio de 2026
- Durante ese período, se contabilizaron más de 28.8 millones de interacciones dirigidas a Claude
- Se utilizaron casi 25 mil cuentas fraudulentas
- Anthropic considera que la destilación es una forma de acelerar que China alcance las capacidades avanzadas de Mythos Preview de Anthropic
Alegato de vínculo con Alibaba Qwen y destinatarios de la carta
- Anthropic afirmó que la campaña fue llevada a cabo por operadores vinculados con Alibaba y con el laboratorio de IA de Alibaba, Alibaba Qwen
- La carta tiene fecha del 10 de junio
- Los destinatarios fueron Tim Scott y Elizabeth Warren, presidente y miembro de mayor rango del Comité Bancario del Senado de EE. UU.
- La carta fue enviada antes de una audiencia sobre IA programada
Casos previos de institutos chinos de IA
- Anthropic ya había dicho en febrero de 2026 que identificó una campaña en la que la startup china de IA DeepSeek y otros dos institutos chinos de IA intentaron extraer ilegalmente capacidades de la plataforma de IA Claude
- La escala presentada por Anthropic en ese momento fue la siguiente
- DeepSeek: más de 150 mil interacciones
- Moonshot AI: más de 3.4 millones
- MiniMax: más de 13 millones
- Anthropic señaló entonces que la intensidad y sofisticación de estas campañas estaban aumentando, por lo que se necesitaba una respuesta rápida y coordinada por parte de la industria, los responsables de formular políticas y la comunidad global de IA
Medidas del gobierno de EE. UU. y restricciones a los modelos de Anthropic
- Anthropic dijo que apoya los esfuerzos de respuesta del gobierno de EE. UU.
- Incluidos el intercambio de inteligencia sobre amenazas con empresas privadas de IA
- Y otras actividades de respuesta conjunta
- En abril de 2026, la Casa Blanca acusó a China de robar propiedad intelectual de laboratorios estadounidenses de IA a escala industrial
- Ese mismo mes, Alibaba fue añadida a la lista de empresas militares chinas del Departamento de Defensa de EE. UU., designación que Alibaba está impugnando
- El Departamento de Comercio de EE. UU. aplazó incluir a DeepSeek en una lista negra comercial, pese a que un comité conjunto del gobierno la consideró un riesgo para la seguridad nacional, al intentar evitar una mayor escalada de tensiones con Beijing
- Dos días después de que Anthropic enviara la carta, el 12 de junio, el Departamento de Comercio de EE. UU. impuso restricciones a los modelos de IA más recientes de Anthropic, Mythos y Fable
- Las autoridades temían que estos modelos pudieran desplegarse para usuarios de inteligencia militar en China y otros países preocupantes
- Como resultado de estas restricciones, Anthropic deshabilitó globalmente el acceso a esos modelos
1 comentarios
Opiniones de Hacker News
Lo dejo por aquí: “un juez determinó que la descarga por parte de Anthropic de más de 7 millones de libros desde sitios pirata como LibGen constituye una infracción, y también rechazó la defensa de Anthropic de que era con ‘fines de investigación’: ‘No puedes bendecirte a ti mismo por tener fines de investigación y luego tomar cualquier libro de texto que quieras.’”
https://www.joneswalker.com/en/insights/blogs/ai-law-blog/wh...
Básicamente hay dos tipos de destilación. 1) la forma tonta a gran escala de hacer preguntas y usar las respuestas como señal de refuerzo (caja negra), y 2) una destilación más dirigida en la que un modelo enseña, entrena y guía directamente a otro (RLAIF)
La segunda es, en esencia, ajustar finamente un modelo siguiendo la orientación de otro. Innumerables empresas hacen este tipo de ajuste fino todos los días. Es casi seguro que los laboratorios chinos también usan este método, porque funciona mucho mejor en el resultado final que simplemente raspar respuestas sencillas a preguntas sencillas
Estas quejas sobre la destilación parecen buscar que el problema se vea más grande de lo que realmente es, y el objetivo da la impresión de ser empujar de forma proteccionista al gobierno de EE. UU. a bloquear o prohibir a los proveedores de modelos chinos. Ya pidieron endurecer los controles de exportación de chips, lo cual da risa considerando que DeepSeek v4 fue diseñado para correr en chips de Huawei y que otras empresas chinas están siguiendo ese camino. Pero como no pueden decirlo abiertamente, afirman que los modelos destilados podrían no ser tan seguros como los suyos y por eso piden más controles de exportación. En cambio, si les muestras un jailbreak que evade las protecciones de seguridad de su propio modelo, dirán que no hay que preocuparse por la seguridad porque cualquier modelo terminará siendo vulnerado
2) Que es imposible crear un modelo de lenguaje grande inmune a todos los jailbreaks. Tampoco hay evidencia confiable que lo refute, así que Anthropic tiene totalmente la razón en eso
Si el punto 1 fuera falso, bastaría con publicar los detalles del jailbreak. Supuestamente solo funciona en Fable 5, así que ni siquiera habría un riesgo posible
Si el punto 2 fuera falso, entonces algún otro laboratorio de modelos de lenguaje grande ya debería haberlo logrado. Más aún cuando varios gobiernos han dejado claro que existe mercado para ese tipo de proyecto
En lo fundamental, es muy difícil impedir esto y a la vez mantener útil a un modelo de IA
Esto me recuerda las quejas de Steve Jobs a mediados y finales de los 80 de que habían copiado la GUI de Mac. Mientras tanto, él no reconocía públicamente el trabajo realizado en el Xerox Alto y el sistema operativo Star
“¡Estás intentando copiar lo que yo ya había copiado!”
Es como rastrear todo internet para crear un enorme modelo de lenguaje grande y luego quejarse de que te están copiando
La información realmente quiere ser libre, pero las empresas de IA quieren ser guardianes. A largo plazo, creo que terminará ganando el enfoque más sostenible de los pesos abiertos
Da mucha risa la hipocresía de Anthropic quejándose de que “extrajeron ilegalmente las capacidades del modelo Claude AI” y respaldando las críticas de la Casa Blanca de que China “roba la propiedad intelectual de laboratorios de IA de EE. UU. a escala industrial”
Anthropic, OpenAI, Google, Microsoft y otras recopilaron contenido a diestra y siniestra e ignoraron los derechos de autor para entrenar sus modelos. ¿Y ahora una de ellas va a gritar que es injusto que otro actor haga lo mismo que todas ellas hicieron?
robots.txty disparar los costos de ancho de banda. Pero si las prácticas de recolección de datos generan costos para los proveedores de IA, entonces eso claramente sería intolerableEsto es lo que está pasando ahora mismo: revendedores chinos están ofreciendo tokens de Claude a precios 70~90% más bajos que los oficiales de la API de Anthropic. Lo logran agrupando cuentas Claude Max y revendiendo capacidad, usando fraude de pagos y revendiendo salidas del modelo y cadenas de razonamiento a varios institutos de investigación chinos. Facilitan el acceso al modelo a cambio de recibir logs de usuarios y rastros de razonamiento, y pueden operar por debajo del costo porque eso luego lo venden como datos de entrenamiento
Tanto Claude como ChatGPT están bloqueados en China. Para acceder necesitas un VPN, y no se puede pagar con tarjetas bancarias chinas. Así que la mayoría de quienes quieren acceso a Claude compran acceso mediante revendedores. Es la forma más fácil y barata de acceder a modelos de Anthropic en China
Estos revendedores operan decenas de miles de cuentas bot, y por eso Anthropic introdujo verificación de identidad para frenar la oleada de bots
Un revendedor de tokens ofrece Opus 4.8 con 93% de descuento frente a la tarifa oficial de la API: https://yunwu.ai/pricing?provider=Anthropic
Esta es una de las razones por las que DeepSeek y GLM son tan baratos. Como tienen que competir con precios de tokens ridículamente bajos en China, deben mantener los precios bajos para que la gente los use
Compartí esto hace unos meses, pero casi no recibió atención. Es un gran texto que explica la economía de la reventa de tokens en China: https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens...
También me enseñaron que si Anthropic quiere competir, tiene que hacer mejor su trabajo. Si no, alguien más va a ganar
¿Ahora ese principio ya no aplica para las grandes empresas estadounidenses?
DeepSeek y GLM son de pesos abiertos, y también proveedores estadounidenses de inferencia los venden mucho más barato. Son baratos porque los modelos son más eficientes
Si no, suena como la típica tesis bajista sobre IA de que “Anthropic/OpenAI vende 1,000 dólares en tokens por 100 dólares y está perdiendo cantidades enormes de dinero”
La conducta de Alibaba se describe como un esfuerzo de “destilación”, que Anthropic definió como entrenar un modelo más débil con las salidas de uno más fuerte
Claude usó terabytes de contenido sin permiso para entrenar su propio modelo y dijo que eso estaba bien. Ahora se quejan de que es injusto que alguien entrene un modelo usando las salidas de Claude
Espero con ganas el juicio en el que Anthropic tendrá que revelar el origen de sus datos de entrenamiento y explicar por qué sí tiene derecho a cobrar a clientes por datos de entrenamiento regurgitados, pero Alibaba no puede entrenar su propio modelo con un modelo de Anthropic
Va a ser divertido
La conducta de Anthropic parece un gesto performativo. Otros ya han especulado sobre quién sería la audiencia objetivo
¿Qué es exactamente lo ilegal aquí?
Legalmente, la salida del modelo no puede estar protegida por propiedad intelectual, ni bajo derecho nacional ni internacional. Lo máximo esperable sería un remedio civil, y aun eso parece difícil considerando que la forma en que ellos mismos entrenaron su modelo fue literalmente ilegal
A Anthropic lo trataron exactamente de la misma manera en que ha tratado a todos los demás. Ya hicieron su cama, ahora les toca acostarse en ella
Dicen que lo de Alibaba es “destilación”, o sea entrenar un modelo más débil con las salidas de uno más fuerte, pero no veo qué tiene de malo.
Anthropic dijo que esta campaña ocurrió del 22 de abril de 2026 al 5 de junio y generó más de 28.8 millones de interacciones con Claude mediante casi 25,000 cuentas fraudulentas.
¿Qué hace que esas cuentas sean fraudulentas? Si pagaron el precio acordado, ¿no debería estar bien? Si no pagaron, ¿por qué Anthropic les dio servicio?
La destilación no se puede impedir de forma fundamental. Lo único que se puede hacer es retrasarla. Demuéstrenme lo contrario.
Al final, las empresas chinas van a sacar extensiones tipo Honey y, montadas sobre clientes reales no chinos, de todos modos enviarán todo a China.
Se acabó.
Pero los laboratorios de IA pueden seguir generando enorme valor económico sin publicar sus modelos ni exponerlos a una posible destilación. Por ejemplo, pueden usarlos solo internamente para desarrollar medicamentos.
Ojalá en algún momento haya un futuro en el que otros también puedan acceder a modelos de frontera, pero si se concluye que es más importante evitar su difusión por destilación, entonces no es estrictamente necesario.
[1]: referencia sobre destilación en https://dualuse.dev/posts/export-controls-on-fable
El punto es que quizá no haya una solución técnica, pero en teoría sí podría haber una solución política.
“False Promise of Imitating Proprietary LLMs”, de Berkeley, también sostiene que la imitación reduce rápido la brecha de estilo, pero la brecha de capacidades sigue siendo grande.
https://arxiv.org/abs/2305.15717