- Qwen2-Math, creado sobre la base del Qwen2 LLM, supera ampliamente las capacidades matemáticas de los modelos open source y de modelos cerrados (por ejemplo, GPT-4o)
- Serie de modelos de lenguaje grandes especializados en matemáticas, que incluye Qwen2-Math y Qwen2-Math-Instruct-1.5B/7B/72B
- Se muestra que el modelo más grande, Qwen2-Math-72B-Instruct, supera a modelos recientes como GPT-4o, Claude-3.5-Sonnet, Gemini-1.5-Pro y Llama-3.1-405B
- Actualmente el modelo solo admite inglés. Próximamente se lanzará un modelo matemático bilingüe (inglés y chino)
1 comentarios
Alibaba, presenta el modelo Qwen 2
Qwen1.5-110B: el primer modelo de más de 100B de la serie LLM open source Qwen1.5 de Alibaba
Alibaba presenta el modelo de IA open source QWEN