- Se informa que la startup china de IA DeepSeek desarrolló su modelo de IA de próxima generación usando chips Nvidia Blackwell sujetos a las prohibiciones de exportación de EE. UU.
- The Information reportó que estos chips fueron introducidos de contrabando en China tras ser desmontados de centros de datos en terceros países donde su venta sí estaba permitida
- EE. UU. prohíbe la exportación a China de semiconductores avanzados, y algunos desarrolladores están accediendo a ellos mediante centros de datos en el extranjero o rutas alternativas
- Nvidia declaró sobre el reporte que “no tiene constancia de que exista una operación así” y mencionó que investigará si recibe denuncias
- Este caso muestra cómo, en medio de la competencia tecnológica entre EE. UU. y China, las empresas chinas de IA buscan asegurarse chips de alto rendimiento
Sospechas sobre el uso de chips prohibidos por parte de DeepSeek
- The Information informó que DeepSeek desarrolló un nuevo modelo de IA usando chips Nvidia Blackwell sujetos a las prohibiciones de exportación de EE. UU.
- Según el reporte, estos chips fueron instalados en centros de datos de países donde su venta estaba permitida, luego desmontados y transportados a China
- También se informó que fueron introducidos tras pasar inspecciones de empresas que desarrollan equipamiento para servidores
- EE. UU. prohíbe la exportación a China de estos semiconductores avanzados
- Como resultado, se han dado casos en los que desarrolladores de IA en China obtienen chips mediante centros de datos en el extranjero o vías no oficiales
Regulaciones de exportación de EE. UU. y casos relacionados
- En noviembre, fiscales de EE. UU. acusaron a dos ciudadanos chinos y dos estadounidenses
- Están acusados de crear una empresa inmobiliaria de fachada para transportar chips a China vía Malasia
- Estos casos se mencionan como parte de las transacciones indirectas surgidas tras el endurecimiento de los controles de exportación de semiconductores por parte de EE. UU.
La postura de Nvidia
- Nvidia afirmó que “no ha recibido confirmación ni denuncias sobre este tipo de contrabando”
- Un portavoz comentó: “Si ese contrabando fuera real, parecería poco probable, pero si recibimos una denuncia, investigaremos”
Contexto de DeepSeek y desarrollo de modelos de IA
- En enero de 2024, DeepSeek anunció que había desarrollado a bajo costo un modelo de IA capaz de competir con los mejores de Silicon Valley
- La empresa recibió financiamiento del hedge fund chino High-Flyer y se sabe que aseguró 10.000 GPU de Nvidia en 2021
- Eso fue antes de que entraran en vigor las medidas de prohibición de exportación de EE. UU.
- En septiembre de 2024, presentó un nuevo modelo y declaró que está colaborando con fabricantes de chips chinos
Las medidas más recientes de EE. UU. y la respuesta de China
- El presidente Donald Trump autorizó a comienzos de esta semana la exportación a China del acelerador de IA H200, un modelo anterior de Nvidia
- Sin embargo, la prohibición de exportación del más potente chip Blackwell sigue vigente
- El gobierno chino está instando a sus empresas tecnológicas a ampliar el uso de equipos nacionales
- DeepSeek también está avanzando en esa línea mediante su colaboración con fabricantes chinos de chips
1 comentarios
Comentarios de Hacker News
Que DeepSeek entrenó su modelo con chips de Nvidia obtenidos antes de la prohibición de exportación de semiconductores de EE. UU. ya era algo conocido
Algunos creen que también pudo haber conseguido chips después por vías no oficiales
También leí en otro lado que usó datos de salida de ChatGPT, Claude y Gemini como datos de entrenamiento
Como es una estructura donde se vuelven a robar datos robados entre sí, un poco de contrabando ni sorprende
Hasta el propio presidente reconoció que EE. UU. aplica estas sanciones por proteccionismo
Anthropic también pagó 1.000 millones de dólares en un acuerdo por infracción de copyright, y al final todos los modelos son el resultado de apropiarse a gran escala de la propiedad intelectual y los datos personales de la humanidad
Apoyo la idea de que los modelos abiertos vencerán a los cerrados
Aunque irónicamente, los TOS de OpenAI incluyen una cláusula que prohíbe usarlos para entrenar modelos competidores
Usar la salida de otros modelos para entrenamiento se llama destilación de conocimiento (distillation)
Incluso modelos viejos de Grok a veces empezaban respondiendo con “as a model trained by OpenAI...”
Si ves el documental de GamersNexus, explica bien cómo funciona el mercado negro de GPU de IA de NVIDIA
Trata sobre la manera en que empresas como DeepSeek consiguen chips esquivando la prohibición de exportación de EE. UU.
El ganador tenía una cuenta australiana, pero la dirección de envío era una casa común en Delaware, EE. UU., y además el nombre era distinto
En estos casos, por lo general estudiantes chinos en el extranjero o migrantes compran GPU y luego las revenden
Supongo que mi 4090 también renacerá en China como una GPU Frankenstein con la VRAM modificada
Una vez que cruza la frontera, la GPU ya está dentro de China
Solo es “contrabando” durante el ingreso; una vez dentro de China, ya no es ilegal
Es completamente esperable que DeepSeek use ese tipo de GPU
Las sanciones solo suben un poco el costo; no lo vuelven imposible
Con componentes electrónicos, petróleo o incluso acceso a ChatGPT, al final todo se consigue si tienes dinero
Aun así, estos bienes sancionados podrían explotarse como herramienta de propaganda
Por ejemplo, imagino qué pasaría si al instalar drivers de Nvidia hubiera que responder preguntas sobre la masacre de Tiananmén
Mover un camión lleno de GPU es muchísimo más sencillo que traficar drogas
Aunque en plataformas públicas sí está prohibido
Por eso dudo de qué tan efectiva sería realmente una estrategia de propaganda así
Aunque no se detenga por completo la flota clandestina que transporta petróleo ruso, solo generar miedo ya puede reducir las ganancias
Bloomberg lo describió como “chips prohibidos dentro de China”, pero
no es lo mismo que EE. UU. prohíba exportarlos a que estén prohibidos dentro de China
Artículo relacionado (Al Jazeera)
Por ejemplo, ha habido muchos casos en que intentó arrestar y extraditar en el extranjero a operadores de sitios de torrents o personas vinculadas a WikiLeaks
Incluso llegó a justificar secuestros y tortura de ciudadanos extranjeros por considerarlos “combatientes enemigos”
Creo que el mundo estaría mejor si EE. UU. no se dedicara a someter a otros países
Todas las potencias tienen el instinto de proteger su estatus
Las sanciones de EE. UU. no son simple proteccionismo, sino también una respuesta a la competencia desleal
Me parece raro que en esta discusión no se mencione para nada la accesibilidad a la nube
Era posible alquilar H100 en servidores de EE. UU. sin ninguna restricción
Para un usuario normal es difícil conseguir una infraestructura de ese nivel
Puede que ni siquiera hiciera falta reiniciar
Esto ni sorprende, y parece que no va a pasar nada
Si el lugar de fabricación está en un país vecino, siempre habrá alguna forma de conseguir chips
A menos que se prohíba por completo la venta internacional de Nvidia, las sanciones tienen poca efectividad
También sería irreal que el gobierno administrara las compras de GPU mediante licencias
Lo que dijo GamersNexus sobre “cerrar un ojo y dejar el otro abierto” es exacto
China ordenó dejar de usar chips de Nvidia, pero en la práctica parece más una señal para impulsar la autosuficiencia
Las sanciones de EE. UU., como la guerra contra las drogas, son una política destinada al fracaso
Aunque sería más ideal si fuera participación voluntaria y no coerción
Si los chips usados esta vez fueron comprados legalmente antes de la prohibición,
en realidad podría tratarse de una polémica sin mucho sentido
Había rumores de que DeepSeek evitó las sanciones y redujo costos bootstrappeando parámetros de otros modelos
Este reporte va en la línea de respaldar ese rumor
Creo que en la práctica es difícil impedir el comercio entre dos países
Las GPU son bienes de bajo volumen de distribución y no se pueden rastrear por satélite,
así que son distintas de productos como el petróleo, cuya infraestructura es visible