1 puntos por GN⁺ 2025-01-30 | 1 comentarios | Compartir por WhatsApp
  • Razones para que DeepSeek sea de código abierto

    • DeepSeek es un laboratorio chino de IA que desarrolló R1, un modelo de razonamiento de código abierto.
    • Desarrolló un modelo con un rendimiento similar al de OpenAI a un costo bajo, gracias a métodos de entrenamiento innovadores.
    • Al ser una empresa china, necesitaba abrir su modelo para ganar confianza en los mercados occidentales.
    • El código abierto no es solo una acción técnica, sino también una acción cultural.
  • La mercantilización de los modelos

    • Los modelos LLM se están mercantilizando cada vez más y no hay grandes diferencias de rendimiento.
    • OpenAI sigue siendo el líder, pero los modelos de código abierto como DeepSeek R1 ofrecen costos más bajos.
    • En infraestructura, el código abierto tiende a ganar a largo plazo.
  • Ventajas del código abierto en infraestructura

    • El código abierto es más barato y permite personalización, pero requiere mantenimiento.
    • La infraestructura siempre necesita personalización y, cuanto más técnico es el producto, más prefieren los ingenieros el código abierto.
    • La razón por la que empresas de código abierto como Lago tienen éxito es que los ingenieros pueden gestionar directamente sistemas de facturación complejos.
  • El futuro de OpenAI

    • OpenAI sigue ocupando una posición importante en el mercado y mantiene el liderazgo en LLM y modelos de razonamiento.
    • Aunque algunos sostienen que modelos como DeepSeek R1 podrían reemplazar a OpenAI, sin la innovación de OpenAI esos modelos tampoco habrían existido.
    • R1 puede impulsar a las grandes empresas existentes a buscar métodos más eficientes.

1 comentarios

 
GN⁺ 2025-01-30
Opiniones de Hacker News
  • Entre las startups chinas de modelos grandes, solo DeepSeek eligió el código abierto sin priorizar la comercialización. Esto le dio promoción orgánica por parte de los usuarios dentro de la comunidad.

    • El CEO de DeepSeek sostiene que el código abierto atrae al mejor talento y aumenta el valor del equipo.
    • Esto es similar a la estrategia que tuvo OpenAI en el pasado, antes de convertirse en la división ClosedAI de Microsoft.
  • Es probable que las API de IA chinas sean recibidas con escepticismo en Occidente. Hay razones históricas válidas para ello.

    • DeepSeek ha sido criticada por censurar respuestas a preguntas delicadas relacionadas con China.
  • Según un memorando interno de Google, se menciona que el código abierto está avanzando más rápido y de manera más eficiente que los equipos cerrados.

    • El futuro de los LLM está en la investigación compartida, y eso parece muy importante.
  • Se argumenta que una empresa con "Open" en su nombre debería compartir las partes importantes, aunque no comparta todo.

    • Como no se proporciona el código fuente, en realidad no es código abierto.
  • Así como Linux tuvo éxito a largo plazo, se espera que los modelos LLM sólidos sigan el mismo camino.

    • Al final, la escala de la infraestructura será lo que marque la diferencia.
  • DeepSeek es un proyecto secundario de un hedge fund, y si vende en corto acciones de NVIDIA y publica todo, podría obtener grandes ganancias.

  • La razón por la que DeepSeek hizo open source su trabajo es que los desarrolladores quieren mostrar algo genial que crearon.

    • Muchas personas intentan encontrar una razón económica, pero quienes realmente lo hicieron son ingenieros, no empresarios. DeepSeek es un proyecto realmente genial, y querían mostrar algo genial que crearon.