- Modelo de IA open source comercial especializado en coreano y cultura coreana
- Disponible en tres tamaños de parámetros: 3B, 1.5B y 0.5B, lo que permite una aplicación personalizada según distintas industrias y entornos de uso
- El modelo 3B cuenta con capacidades de comprensión de imágenes y video, por lo que está optimizado para aplicaciones multimodales
- Los modelos 1.5B y 0.5B destacan en comprensión y generación basadas en texto, y en particular muestran un rendimiento superior al de modelos competidores en procesamiento del coreano
- Los modelos pueden descargarse desde Hugging Face y, si se cumplen ciertas condiciones, también pueden usarse libremente con fines comerciales
Sembrando semillas en el ecosistema de IA: HyperCLOVA X SEED, IA open source comercial
- HyperCLOVA X SEED es un modelo de IA open source utilizable comercialmente
- Forma parte de un esfuerzo para crear un ecosistema de IA especializado en coreano y cultura coreana
- Se lanzó en tres tamaños de modelo (3B, 1.5B y 0.5B), lo que permite una aplicación flexible en distintos entornos
HyperCLOVA X SEED 3B
- Modelo optimizado para comprensión de imágenes (vision understanding)
- Puede procesar con precisión información visual dentro del contexto del coreano y la cultura coreana
- Ejemplo: puede identificar lugares dentro de un video y sugerir rutas de viaje en tareas complejas de preguntas y respuestas
- Puede usarse en guías turísticas, sistemas de preguntas y respuestas basados en imágenes y otros casos
- Los resultados de benchmark demostraron un alto rendimiento en comprensión visual y textual basada en coreano
HyperCLOVA X SEED 1.5B
- Modelo centrado en texto con capacidad de seguir instrucciones
- Puede realizar tareas avanzadas de generación de texto, como traducción, resumen e instrucciones de formato
- Tiene capacidades de traducción y procesamiento no solo en coreano, sino también en idiomas principales como inglés y japonés
- También puede responder en formatos específicos como JSON o en tono informal
- Registró un rendimiento superior al de modelos competidores en benchmarks clave de coreano (KMMLU, KoBEST, etc.)
HyperCLOVA X SEED 0.5B
- Modelo ultrapequeño y liviano, capaz de mantener conversaciones naturales en coreano y responder preguntas de conocimiento
- Adecuado para móviles, smart home y dispositivos wearables en entornos con recursos limitados
- Ejemplo: ofrece respuestas estructuradas a preguntas de la vida diaria, como consejos de interiorismo
- Muestra un rendimiento sobresaliente frente a modelos de su misma categoría en benchmarks de coreano como KMMLU y KoBEST
- Logró una alta eficiencia con un costo de entrenamiento 39 veces menor que el de modelos competidores
Comparación de costos de entrenamiento:
- HyperCLOVA X SEED 0.5B: 4,358 horas de GPU A100, costo de $6,537
- QWEN2.5-0.5B: 169,257 horas de GPU A100, costo de $253,886
Cómo usar HyperCLOVA X SEED
- Los modelos pueden descargarse desde Hugging Face
- La mayoría de los usos comerciales están permitidos libremente (salvo ciertas condiciones)
- Está previsto ofrecer soporte de infraestructura de prueba para empresas e instituciones usuarias
- Naver apoyará a las empresas para fortalecer su competitividad en IA propia como aliado en el camino hacia la sovereign AI
5 comentarios
Mmm.......
Ahora que veo por qué la licencia se termina en caso de una demanda por patentes, resulta que las televisoras le habían metido una demanda a Naver Clova jajaja
Leyendo la licencia, la verdad es que no es open source. Solo la dejaron disponible públicamente, nada más...
https://opensource.org/osd
Revisé la licencia y no cumple con los criterios de la OSD mencionados arriba. Les pido por favor que eliminen cualquier mención a «código abierto» y la cambien por «código fuente publicado» o «fuente disponible», para que la expresión sea precisa.
https://opensource.org/ai/open-source-ai-definition
También existe una definición reciente sobre lo que es la IA de código abierto. No he podido verificar esta parte con exactitud, pero creo que según si cumple o no con esa definición, se podrá determinar si es posible usar el término "IA de código abierto".