- La revolución de la IA open source todavía no ha ocurrido
- Claro que hay modelos de pesos abiertos impresionantes, y agradecemos a quienes publican esos pesos, pero si no puedes reproducir el modelo, no es verdadero open source
- Imagina que en Linux solo publicaran binarios sin el codebase. O imagina que publicaran solo el codebase sin el compilador usado para generar los binarios. Esa es exactamente la situación actual
- Esto tiene varias desventajas
- No se puede volver a contribuir al proyecto
- El proyecto no puede beneficiarse del ciclo de retroalimentación del OSS
- Es difícil verificar que el modelo no tenga puertas traseras, como agentes durmientes
- No se puede verificar si los filtros de datos y contenido coinciden con las políticas de la empresa
- Dependes de la empresa para actualizar el modelo
- Un proyecto de LLM verdaderamente open source, donde todo esté abierto desde el codebase hasta el pipeline de datos, puede generar mucho valor y creatividad, además de mejorar la seguridad
- Pero reproducir los pesos no es tan simple como compilar código, así que no es algo sencillo. Se necesita capacidad de cómputo y know-how.
- Y revisar contribuciones es difícil porque no se puede saber cómo afectarán el rendimiento hasta ejecutar el siguiente entrenamiento
- Pero una persona o grupo con suficiente motivación puede resolver estos detalles, y aunque quizá se vea muy distinto al OSS existente, estos nuevos desafíos son la razón por la que este espacio es tan interesante
3 comentarios
Es cierto,
Por lo tanto, el open source ahora se está convirtiendo en un mito o una leyenda urbana. De hecho, puede decirse que en estos sitios casi no existen modelos open source en el verdadero sentido de la palabra, es decir, perfectamente reproducibles. La mayoría son trucos de marketing.
Lo entiendo, pero... hoy en día los modelos que salen requieren tal nivel de poder de cómputo y tiempo de entrenamiento que a una persona común ya le resulta difícil reproducirlos, así que no estoy muy seguro de cómo verlo.
Eso sí, en cuanto a publicar el dataset, ahí sí comparto bastante la idea.
Opiniones de Hacker News