La necesidad de que DeepSeek sea de código abierto
(getlago.com)-
Razones para que DeepSeek sea de código abierto
- DeepSeek es un laboratorio chino de IA que desarrolló R1, un modelo de razonamiento de código abierto.
- Desarrolló un modelo con un rendimiento similar al de OpenAI a un costo bajo, gracias a métodos de entrenamiento innovadores.
- Al ser una empresa china, necesitaba abrir su modelo para ganar confianza en los mercados occidentales.
- El código abierto no es solo una acción técnica, sino también una acción cultural.
-
La mercantilización de los modelos
- Los modelos LLM se están mercantilizando cada vez más y no hay grandes diferencias de rendimiento.
- OpenAI sigue siendo el líder, pero los modelos de código abierto como DeepSeek R1 ofrecen costos más bajos.
- En infraestructura, el código abierto tiende a ganar a largo plazo.
-
Ventajas del código abierto en infraestructura
- El código abierto es más barato y permite personalización, pero requiere mantenimiento.
- La infraestructura siempre necesita personalización y, cuanto más técnico es el producto, más prefieren los ingenieros el código abierto.
- La razón por la que empresas de código abierto como Lago tienen éxito es que los ingenieros pueden gestionar directamente sistemas de facturación complejos.
-
El futuro de OpenAI
- OpenAI sigue ocupando una posición importante en el mercado y mantiene el liderazgo en LLM y modelos de razonamiento.
- Aunque algunos sostienen que modelos como DeepSeek R1 podrían reemplazar a OpenAI, sin la innovación de OpenAI esos modelos tampoco habrían existido.
- R1 puede impulsar a las grandes empresas existentes a buscar métodos más eficientes.
1 comentarios
Opiniones de Hacker News
Entre las startups chinas de modelos grandes, solo DeepSeek eligió el código abierto sin priorizar la comercialización. Esto le dio promoción orgánica por parte de los usuarios dentro de la comunidad.
Es probable que las API de IA chinas sean recibidas con escepticismo en Occidente. Hay razones históricas válidas para ello.
Según un memorando interno de Google, se menciona que el código abierto está avanzando más rápido y de manera más eficiente que los equipos cerrados.
Se argumenta que una empresa con "Open" en su nombre debería compartir las partes importantes, aunque no comparta todo.
Así como Linux tuvo éxito a largo plazo, se espera que los modelos LLM sólidos sigan el mismo camino.
DeepSeek es un proyecto secundario de un hedge fund, y si vende en corto acciones de NVIDIA y publica todo, podría obtener grandes ganancias.
La razón por la que DeepSeek hizo open source su trabajo es que los desarrolladores quieren mostrar algo genial que crearon.