Yi - LLM bilingüe open source de próxima generación
(github.com/01-ai)- Modelo de lenguaje grande open source de próxima generación, entrenado desde cero por desarrolladores
- Fue entrenado como un modelo bilingüe sobre un corpus multilingüe de 3T, mostrando un rendimiento sólido en comprensión del lenguaje, razonamiento de sentido común y comprensión lectora
- Está basado en modelos de lenguaje preentrenados de 6B y 34B, y se expande a modelos de chatbot, modelos de contexto largo de 200K, modelos de escalado profundo y modelos visión-lenguaje
- El modelo Yi-34B-Chat
- Ocupó el segundo lugar en el leaderboard de AlpacaEval, detrás de GPT-4 Turbo, superando a otros LLM
- Supera a los modelos open source existentes tanto en inglés como en chino, y ocupa el primer lugar en diversos benchmarks
- Aunque adopta la misma arquitectura de modelo que Llama, no es un modelo derivado de Llama. No usa los pesos de Llama
- Está disponible en varios tamaños y los modelos pueden ajustarse finamente según requisitos específicos
- Modelos de chat
- Yi-34B-Chat, Yi-34B-Chat-4bits, Yi-34B-Chat-8bits
- Yi-6B-Chat, Yi-6B-Chat-4bits, Yi-6B-Chat-8bits
- Modelos base
- Yi-34B, Yi-34B-200K
- Yi-9B
- Yi-6B, Yi-6B-200K
- Modelos de chat
1 comentarios
Opiniones de Hacker News