- La salida masiva de investigadores clave del equipo de Qwen de Alibaba ha dejado incierto el futuro de la recién publicada serie de modelos Qwen 3.5
- El líder del equipo, Lin Junyang, anunció su renuncia, y después varios integrantes fundamentales también dejaron la empresa
- La recién lanzada familia de modelos Qwen 3.5 ha llamado aún más la atención porque muestra un rendimiento sobresaliente incluso en modelos pequeños
- La posible disolución del equipo de Qwen podría convertirse en un punto de inflexión importante para el ecosistema chino de investigación de IA de código abierto
Cambios de personal en el equipo de Qwen
- Justo después de que Alibaba publicara la serie de modelos Qwen 3.5, el líder del equipo, Lin Junyang, anunció su salida en X (antes Twitter) con el mensaje: “me stepping down. bye my beloved qwen.”
- Lin fue un investigador clave que lideró la publicación de modelos de pesos abiertos de Qwen desde 2024, y era una de las personas más jóvenes con rango P10 dentro de Alibaba
- Según un reporte del medio chino 36Kr, alrededor de la 1 p. m. del 4 de marzo, el Tongyi Lab de Alibaba convocó una reunión de emergencia de toda la empresa, y el CEO Wu Yongming explicó personalmente la situación al equipo de Qwen
- La renuncia de Lin se había anunciado 12 horas antes, a las 00:11 de la madrugada, y se informó que incluso dentro del equipo el impacto fue grande
- Hacia las 2 p. m., Lin dejó en WeChat un mensaje que decía: “Hermanos de Qwen, sigan como estaba planeado. No hay problema”, pero no aclaró si regresaría o no
- Integrantes del equipo de Qwen dijeron a 36Kr que “el liderazgo de Junyang fue el factor clave para lograr los resultados actuales con muchos menos recursos que los competidores”
- Como posible detonante de la renuncia se menciona una reestructuración organizacional interna en Alibaba, en la que un nuevo investigador procedente del equipo Gemini de Google habría sido designado como responsable de Qwen, aunque se trata de información no confirmada
Salida en cadena de personal clave
- Tras la renuncia de Lin, se confirmó que varios miembros clave también dejaron la empresa
- Binyuan Hui: líder del desarrollo de código de Qwen, responsable de la serie Qwen-Coder, encargado de todo el proceso de entrenamiento de agentes, y recientemente involucrado en investigación de robótica
- Bowen Yu: líder del post-training de Qwen, encabezó el desarrollo de la serie Qwen-Instruct
- Kaixin Li: colaborador clave en Qwen 3.5/VL/Coder, doctor por la Universidad Nacional de Singapur
- Además de ellos, se reportó que varios investigadores jóvenes también renunciaron ese mismo día
- El hecho de que el CEO de Alibaba asistiera personalmente a la reunión muestra que la empresa reconoce la gravedad de la situación
Características de los modelos Qwen 3.5
- Qwen 3.5 es una familia de modelos de pesos abiertos publicada por el equipo Qwen de Alibaba en las últimas semanas, y su rendimiento es muy destacado
- Qwen3.5-397B-A17B, publicado el 17 de febrero, es un modelo grande de 807 GB
- Después se publicaron de forma continua modelos de distintos tamaños, como 122B, 35B, 27B, 9B, 4B, 2B y 0.8B
- Los modelos 27B y 35B han recibido buenas evaluaciones en programación, mientras que los modelos 9B, 4B y 2B resultan muy eficientes para su tamaño
- Los modelos 27B y 35B pueden ejecutarse en Macs con 32 GB/64 GB y aun así manejar muy bien tareas de programación
- En particular, el modelo 2B pesa apenas 4.57 GB (1.27 GB cuantizado), pero aun así ofrece capacidades de razonamiento y multimodales (visión)
Perspectivas a futuro
- Si el equipo de Qwen se disuelve, existe la posibilidad de que se interrumpan los avances de investigación que han permitido ofrecer alto rendimiento en modelos pequeños
- Si los integrantes del equipo fundan un nuevo laboratorio de investigación o se suman a otras instituciones, todavía hay expectativa por los trabajos posteriores
- Por ahora, la situación sigue “aún incierta”, y también existe la posibilidad de que Alibaba logre retener a parte del personal
Fuentes externas citadas
2 comentarios
La renuncia de Lin Junyang sí es impactante. He estado usando mucho Qwen 3.5 35B-A3B, así que tenía expectativas por Qwen 4 :(
Comentarios en Hacker News
He estado probando Qwen3.5-35B-A3B durante los últimos días y, hasta ahora, es el modelo con mejor capacidad de codificación agéntica que he usado
Le hice escribir código Rust y Elixir con Pi harness, y crea sus propias pruebas y verifica por sí mismo si las pasa. Maneja bien los bucles de errores de pruebas o compilación mientras sigue avanzando hacia el objetivo
Eso sí, a mitad del proceso tiende a ignorar las instrucciones y borrar por completo el código de soporte porque “esto sería más simple”
Eligió deadpool y deadpool-r2d2 en la etapa de planificación y terminó confundiéndose. Aun así, en general el código está bien, y parece que solo habría que retocar un poco la capa de base de datos
Hasta ahora es el modelo autoalojable más estable
Desde la perspectiva de una empresa, se entiende un cambio de estrategia, pero no queda claro por qué dejaron ir al equipo central de investigación. ¿No estamos justo en una época en la que faltan investigadores de modelos?
En un ambiente así, por mucho dinero que gasten los laboratorios de EE. UU., es difícil atraer talento
Además, en las empresas chinas pueden tener una mayor influencia en la toma de decisiones
Desde la administración Trump ya venía bajando la llegada de estudiantes internacionales de posgrado, y ahora incluso se percibe que hacer un doctorado en EE. UU. implica un riesgo reputacional
Si un modelo en la nube desperdicia tokens, duele por el costo; pero si un modelo local entra en un bucle, se siente como “está pensando”
Si modelos como Qwen llegan a ser suficientemente útiles para programación local, el cambio probablemente será más económico que técnico
Tiene un rendimiento sobresaliente para su tamaño, aunque en instrucciones largas tiende a ignorar más o menos la mitad. A este tamaño, es un intercambio aceptable
Incluso realiza verificación de citas erróneas, y se ha usado con artículos de arXiv
Los resultados están reunidos en esta página
En realidad pensaba que este tipo de investigación debía estar financiada por gobiernos, pero ahora son empresas chinas las que están ocupando ese papel
También fue bastante rápido
Si la IA realmente pudiera reemplazar por completo a las personas, los CEOs no tendrían que esforzarse tanto en convencer a todos