5 puntos por GN⁺ 2025-01-30 | 2 comentarios | Compartir por WhatsApp
  • OpenAI dijo al Financial Times que encontró pruebas de que la startup china de IA DeepSeek usó sus modelos propietarios para entrenar un modelo competidor de código abierto
  • Se sospecha que DeepSeek utilizó la técnica de "destilación de conocimiento (distillation)", que aprovecha las salidas de modelos grandes para entrenar de forma eficiente modelos más pequeños
  • La destilación es un método común en la industria de la IA, pero OpenAI sostiene que el uso que DeepSeek habría hecho de ella para desarrollar un modelo propio violó sus términos de servicio
  • Según los términos de OpenAI, los usuarios no pueden copiar las salidas de OpenAI ni usarlas para desarrollar modelos competidores

Rendimiento del modelo de DeepSeek y reacción del mercado

  • El lanzamiento del modelo de razonamiento R1 de DeepSeek sorprendió a la industria tecnológica y a los inversionistas
  • DeepSeek está atrayendo la atención del sector al construir modelos de alto rendimiento con costos relativamente bajos
  • Las acciones de Nvidia cayeron 17% el lunes, borrando 589 mil millones de dólares de su capitalización de mercado, aunque el martes repuntaron 9%
  • La caída de Nvidia se debió a preocupaciones sobre una posible disminución en la demanda de hardware para IA

Respuesta de OpenAI y Microsoft

  • OpenAI y Microsoft investigaron y bloquearon el año pasado cuentas sospechosas de que DeepSeek intentó usar la API de OpenAI para hacer destilación
  • Bloomberg fue el primer medio en informar sobre este caso
  • Microsoft evitó comentar al respecto y OpenAI también rechazó hacer comentarios adicionales

Opiniones de expertos

  • David Sacks, exresponsable de IA y criptomonedas en la administración Trump, afirmó que "podría haber habido robo de propiedad intelectual"
  • Algunos investigadores de IA analizaron que el modelo de DeepSeek muestra indicios de haber aprendido de las salidas de GPT-4
  • Ritwik Gupta, investigador doctoral en IA de UC Berkeley, explicó que en la industria de la IA es una práctica común entrenar modelos utilizando las salidas de LLM comerciales

Respuesta de OpenAI y perspectivas futuras

  • OpenAI advirtió que varias empresas, incluidas algunas de China, están intentando destilar modelos de compañías estadounidenses de IA
  • Señaló que está decidiendo con cautela qué capacidades de vanguardia de sus modelos hacer públicas para proteger su propiedad intelectual, y subrayó que es importante colaborar con el gobierno de EE. UU. para evitar fugas tecnológicas
  • Sin embargo, la propia OpenAI también enfrenta controversias de derechos de autor, incluyendo demandas de medios como The New York Times y otros titulares de derechos por presunto uso no autorizado de datos

2 comentarios

 
botplaysdice 2025-02-01

OpenAI está en litigio con The New York Times, pero si esto es así, ¿DeepSeek queda libre de esa demanda? :)

 
GN⁺ 2025-01-30
Opiniones en Hacker News
  • Se argumenta que afirmar que es injusto que DeepSeek haya usado datos de OpenAI para entrenar, cuando OpenAI también recopiló datos de internet para entrenar, es una postura inapropiada

    • Puede que no sea cierto que DeepSeek haya reproducido desde cero un rendimiento al nivel de o1, lo que plantea dudas sobre la eficiencia de su entrenamiento
    • El paper de R1 de DeepSeek muestra que la destilación es muy potente, y si DeepSeek entrenó su modelo usando salidas de o1, eso podría generar dudas sobre la eficiencia del entrenamiento
  • Hay opiniones de que la publicación de DeepSeek como código abierto y bajo licencia MIT podría ser una oportunidad para atraer gran talento

    • La apertura del código de nuevas tecnologías históricamente siempre ha impulsado el progreso
    • OpenAI está colaborando con el gobierno de EE. UU. para proteger su propiedad intelectual, y existe la posibilidad de que DeepSeek sea prohibido como TikTok
  • R1 fue creado en un mundo posterior a o1, donde otros modelos también pueden destilar a partir de R1

    • Hay quienes opinan que destilar desde o1 no debilita las afirmaciones de costo de DeepSeek
    • Se cuestiona si OpenAI realmente tiene alguna superioridad moral o ética
  • Si DeepSeek recibió entrenamiento a partir de OpenAI, entonces no fue entrenado desde cero por "centavos por dólar" y podría no tratarse de un avance técnico

    • Esto todavía no se ha confirmado como un hecho
  • OpenAI está actualmente en una posición débil y no puede aprovechar recursos legales como Google o Microsoft

    • Hay opiniones de que una estrategia de OpenAI para frenar a competidores mediante problemas legales no sería efectiva
  • Al igual que en la industria ferroviaria, en la IA la competencia reduce costos, y es posible que la mayoría de las inversiones no generen grandes fortunas

    • Grandes empresas como Nvidia, OpenAI y DeepSeek invierten en IA, pero quizá no logren generar ganancias reales
  • Críticas a OpenAI por usar contenido sin permiso y por gastar grandes sumas para evadir scripts de adicción a la IA

    • Si DeepSeek recicló datos de OpenAI, se opina que eso no sería un avance de ingeniería
  • Los modelos de OpenAI fueron entrenados con ebooks recolectados masivamente de un rastreador privado de torrents de libros electrónicos

    • Los ebooks fueron convertidos y organizados en formato epub, y alojados en un repositorio público de datos