La verdad detrás del "90% de descuento en Claude": resultó ser una vía para robar datos de entrenamiento de IA

(kmjournal.net)

14 puntos por princox 2026-05-13 | 8 comentarios | Compartir por WhatsApp

Hola. Hoy les comparto una noticia un poco interesante, pero también preocupante. Se descubrió que Claude, el modelo de IA generativa de Anthropic, se está comercializando en el mercado negro chino a alrededor del 10% de su precio oficial, es decir, con un descuento del 90%. Si solo fuera una simple reventa ilegal, podría parecer algo menor, pero el verdadero problema sería otro. Según se informa, se está usando como una vía para extraer los datos de prompts de los usuarios y aprovecharlos como insumo de entrenamiento para otros modelos de IA.
¿Cómo fue posible ofrecer un 90% de descuento?
Según el estado de la llamada "economía de proxies de API (API Proxy Economy)" revelado recientemente por la investigadora Zhilan Chen, del Oxford China Policy Lab, redes de proxies conocidas localmente como "centros de retransmisión" estarían operando casi abiertamente en GitHub, Telegram, Taobao y otras plataformas.
Los métodos usados para bajar tanto el precio son, en general, los siguientes.

Crear masivamente cuentas de prueba gratuitas y luego revender los permisos de API
Suscribirse a planes pagos con tarjetas de crédito robadas y repartir el acceso
Tomar un solo plan Max de unos 200 dólares al mes y venderlo dividido entre varios usuarios
Ir un paso más allá con el "cambio de modelo": el usuario cree que está usando el modelo premium Claude Opus, pero en realidad recibe respuestas generadas por Haiku, que es más barato, o incluso por modelos open source

El rendimiento ni siquiera llegó a la mitad
Según el análisis de 17 servicios proxy realizado por investigadores del CISPA Helmholtz Center for Information Security de Alemania, con base en un benchmark del área médica, la API oficial mostró una tasa de acierto de cerca del 84%, mientras que los servicios proxy se quedaron en alrededor del 37%. En otras palabras, los datos objetivos muestran que, así como se ahorra en precio, también cae fuertemente la calidad del resultado.
Lo que realmente buscaban eran los "datos de prompts"
Hay otro punto que la industria considera todavía más grave. Los operadores de estos proxies estarían almacenando tanto los prompts de los usuarios como las respuestas de la IA e incluso el proceso de razonamiento (Chain of Thought, CoT), para luego procesarlos y venderlos como datasets de entrenamiento.
Si lo pensamos, los prompts refinados con mucho cuidado por usuarios avanzados de IA, junto con los datos de cadena de pensamiento, son activos extremadamente valiosos para mejorar el rendimiento de un modelo. Incluso han surgido análisis que sugieren que esta estructura de obtención de datos habría influido en cierta medida en el rápido avance reciente de la capacidad de razonamiento de los modelos chinos de IA.
De hecho, Anthropic anunció en febrero de este año que más de 16 millones de consultas provinieron de unas 24,000 cuentas fraudulentas presuntamente vinculadas con empresas chinas como DeepSeek, Moonshot AI y MiniMax.
La sombra mayor: filtración de código fuente
También están creciendo las preocupaciones en materia de seguridad. Hoy en día, muchos desarrolladores usan agentes de IA para programación ingresando no solo código fuente, sino también estructuras de API e incluso credenciales internas de autenticación. Pero si todo eso pasa por servidores proxy no verificados, existe el riesgo de que información interna de una empresa termine fluyendo tal cual hacia servidores externos.
La investigadora Chen explicó que "usar servicios de IA a través de proxies no verificados equivale, en la práctica, a enviar datos confidenciales a los servidores de un tercero".
Para cerrar
Este caso va más allá de un simple problema de distribución ilegal y sugiere algo importante: en la era de la IA se está formando un nuevo "mercado de robo de datos". Si se topan con una API gateway demasiado barata, vale la pena sospechar al menos una vez qué puede estar ocurriendo detrás. Sobre todo si usan agentes de código para trabajar con código de su empresa, convendría revisar nuevamente hacia dónde está fluyendo el tráfico.
Fuente: KMJ — https://www.kmjournal.net/news/articleView.html?idxno=11241

8 comentarios

kimjoin2 2026-05-14

Hay mucha gente ingenua.

sacru2red 2026-05-14

Uf... ¿esto no es prácticamente un hackeo?

loblue 2026-05-14

¿OpenRouter no tendrá problemas, cierto? -.-

gpdir16 2026-05-14

Ahí es oficial, así que no habrá problema.

hshim 2026-05-14

Da pena que estén haciendo algo así con tanto descaro...

recast7838 2026-05-13

duddnd649 2026-05-13

Uf..

ligion 2026-05-13

El karma hizo lo suyo

La verdad detrás del "90% de descuento en Claude": resultó ser una vía para robar datos de entrenamiento de IA

Lecturas relacionadas

8 comentarios