Lanzamiento de GLM 5.2
(twitter.com/jietang)- GLM-5.2 es un modelo open source con 1M de contexto realmente utilizable y soporte para completar tareas de larga duración de forma autónoma, lo que proporciona una base para construir aplicaciones de agentes complejas
- En una situación donde el acceso a modelos frontier utilizables se bloquea de repente por razones no técnicas, la ciencia debe ser global y el camino hacia la AGI no debe quedar atrapado tras barreras altas
- La AGI no debe ser un privilegio monopolizado por unas pocas reglas ni algo que pueda retirarse en cualquier momento, sino una base compartida para que la humanidad explore junta los límites de la inteligencia y resuelva tareas complejas
- GLM-5.2 es el modelo open source más potente de Zhipu hasta ahora, y sigue funcionando como el motor principal para construir el modelo de coding más fuerte del país
- Primero estará disponible para los usuarios Lite / Pro / Max del GLM Coding Plan, y la API se publicará la próxima semana, acercando un paso más el acceso a la inteligencia frontier
Mensaje clave
- La restricción repentina de ciertos modelos frontier se presenta como algo profundamente lamentable, y refuerza la postura de que la ciencia debe ser global precisamente cuando el acceso se corta por razones no técnicas
- El camino hacia la AGI no debe estar rodeado de barreras altas, y la AGI debe ser una piedra angular para que la humanidad explore en conjunto los límites de la inteligencia y resuelva desafíos complejos
- La AGI no debe ser un privilegio monopolizado por unas pocas reglas ni algo que pueda retirarse en cualquier momento; frente al bloqueo y las restricciones externas, se necesita una apertura radical
- La inteligencia frontier debe seguir siendo open source, accesible y construible, y debe estar disponible para todos los desarrolladores comprometidos
Presentación de GLM-5.2 y calendario de disponibilidad
- GLM-5.2 es el modelo open source más potente que Zhipu ha publicado hasta la fecha
- Este modelo admite una ventana de contexto de 1M realmente utilizable y mantiene una ventaja sostenida en la finalización autónoma de tareas de larga duración
- Proporciona una base sólida para crear aplicaciones de agentes complejas y sigue funcionando como el motor principal para construir el modelo de coding más fuerte del país
- GLM-5.2 estará disponible oficialmente a las 5:21 para los usuarios del GLM Coding Plan, incluyendo a los usuarios Lite / Pro / Max
- La API se publicará la próxima semana y el ModelKey es
GLM-5.2
1 comentarios
Comentarios en Hacker News
Según el anuncio del fundador de Z.ai, GLM-5.2 es un modelo “totalmente abierto”, y dice que la inteligencia de frontera debería estar abierta para todos en momentos en que el acceso a algunos modelos de frontera se restringe repentinamente por razones no técnicas
GLM-5.2 es el modelo open source más potente de Zhipu hasta ahora, y destaca por su ventana de contexto de 1M realmente utilizable y su capacidad para ejecutar tareas de largo plazo de forma autónoma
Indicó que primero estará disponible para los usuarios Lite / Pro / Max de GLM Coding Plan, y que la API se publicará la próxima semana
https://x.com/jietang/status/2065784751345287314
Parece ser distinto de otros modelos chinos de pesos abiertos como Qwen
Todavía no parece haber una entrada oficial en el blog con resultados de benchmarks, pero una vez más se agradece que los laboratorios chinos de IA publiquen este tipo de trabajo y contribuyan al mundo con una licencia permisiva
El caso de Fable vuelve a mostrar lo valiosos que son estos modelos abiertos
Aun así, es bastante impresionante y perfectamente utilizable
En arquitectura o problemas complejos se nota claramente más débil, pero probablemente no muchos esperaban otra cosa
En especial, parece rendir por encima de su categoría en diseño e interfaz de usuario, aunque eso también puede ser gusto personal
En los últimos días, los laboratorios chinos han lanzado MiniMaxM3, KimiK2.7 y GLM5.2, mientras tanto EE. UU. está censurando modelos
Casi parece una novela
En el caso actual de Anthropic, se podría decir que EE. UU. está censurando modelos, pero parece encajar mejor con la corrupción general, las represalias, la extorsión y la incompetencia de la administración Trump
Parece que no es la biblioteca de C++ OpenGL Mathematics que esperaba
Viendo las últimas acciones del gobierno de EE. UU. con Fable, esta tendencia cada vez parece más el futuro
No se puede depender de productos estratégicos cuyas puertas puede cerrar un actor caprichoso
Los modelos de pesos abiertos son, en esencia, casi inmunes a esa situación
El gobierno de EE. UU. podría volver ilegal comerciar con modelos extranjeros de pesos abiertos, descargarlos o usarlos
Sería difícil aplicarlo contra individuos, pero las empresas básicamente obedecerían, y si se hace vía sanciones, incluso podrían bajarlos de hostings con sede en EE. UU. como GitHub
Además, ya vamos muy rápido hacia un nivel aterrador de vigilancia masiva, lo que también podría facilitar la aplicación
La situación de Fable está creando un precedente muy peligroso, y me preocupa el futuro porque parece que estamos perdiendo la lucha por la libertad de información y de cómputo
Anthropic es quien está alimentando esta estupidez
Baja la calidad de los resultados sin avisar y rechaza solicitudes en nombre de la “seguridad”
Incluso si el gobierno no le hubiera ordenado retirar el modelo para extranjeros, la situación igual habría sido muy mala porque Anthropic por sí sola ya es pésima
Anthropic lo publicó exactamente a la misma hora, 5:21 p. m. hora de China, en que recibió del gobierno la carta de prohibición sobre Fable, y menciona explícitamente la situación en la que otros modelos dejan de estar disponibles
Se ve bastante raro
También me pregunto si no habrán editado la publicación después
Parece que este lanzamiento se adelantó apresuradamente para subirse al drama de Mythos
Algo como: “Qué pena que ya no puedas usar Fable, pero prueba el nuestro durante el fin de semana”, y es posible que originalmente estuviera previsto para la próxima semana, por eso quizá los benchmarks todavía no estaban listos
Estoy esperando el lanzamiento de 5.2 flash
Ya pasó algo de tiempo, pero sigo sintiendo que 4.7 flash es uno de los modelos locales de programación más fuertes
Entre los modelos locales, Qwen-3.5 sigue siendo el mejor
3.6 ya se pasa un poco de los 24GB de uso de VRAM, y a partir de ahí ya no estás usando una GPU de consumo
Me gustaría que escribieran una entrada de blog que explicara la capacidad del nuevo modelo, qué se puede esperar, si es más barato, más rápido, si la calidad de salida es mejor, etc.
Aun así, se agradece que lo hayan publicado
Me gustaría saber cuántos recursos de cómputo requiere realmente, y los requisitos de las distintas variantes
También quiero saber si, con optimizaciones de Google como TurboQuant y MTP o innovaciones propias, lograron hacer que una calidad de frontera sea realmente accesible para usuarios locales
No es un modelo local en un sentido razonable, pero como es un modelo abierto, una vez que suban los pesos dentro de una semana o algo así, aparecerán varios proveedores externos de inferencia compitiendo por precio por token
No existe tal cosa como un modelo local que funcione de forma efectiva en hardware de consumo, y quien diga eso está mintiendo o delirando