ZCode: arnés oficial para GLM-5.2

(zcode.z.ai)

1 puntos por GN⁺ 5 시간 전 | 1 comentarios | Compartir por WhatsApp

ZCode es el arnés oficial para GLM-5.2 que busca integrar herramientas de desarrollo y agentes de IA para manejar planificación, programación, revisión y despliegue dentro de un solo flujo
ZCode 3.0 destaca la optimización para GLM-5.2 y mejoras en la colaboración multiagente, subrayando su integración con GLM a lo largo de tareas de razonamiento y programación
La tarea de ejemplo crea desde cero un juego de Gomoku AI basado en navegador y, tras generar index.html, app.js y styles.css, también pasa la verificación con node --check app.js
Los planes se presentan como Lite $16.2/mes, Pro $64.8/mes y Max $144/mes, y el precio final y los beneficios deben confirmarse en z.ai
Ofrece instaladores para macOS, Windows y Linux, y Linux aparece como Beta con .deb y AppImage para x64 y ARM64

Arnés de desarrollo ajustado para GLM-5.2

ZCode es una herramienta que combina agentes de IA con herramientas de desarrollo existentes para ayudar a que la planificación, la programación, la revisión y el despliegue se realicen con menos fricción
Su posicionamiento de producto es “Simple, Fast, Vibe‑Ready” y se presenta como el arnés oficial para GLM-5.2
ZCode 3.0 fue optimizado para GLM-5.2 y presenta como cambio principal una mejora en la colaboración multiagente

Ejemplo de flujo de trabajo

La lista de tareas de ejemplo incluye gomoku-ai, zcode-website, zcode-desktop y release-bot
gomoku-ai es una tarea para crear un Gomoku inteligente, es decir, un juego de cinco en línea
- El jugador compite contra un algoritmo inteligente
- El objetivo es hacer jugadas estratégicas y detectar con precisión las condiciones de victoria
Según el registro de trabajo, el repositorio existente estaba vacío o casi vacío, así que el flujo avanza creando la app desde cero
- La ejecución de git status --short devuelve un error indicando que el directorio actual no es un repositorio Git
- Después se crean los archivos index.html, app.js y styles.css

Resultado de la implementación de Gomoku

El ejemplo terminado es un juego de Gomoku independiente para navegador
- Renderiza un tablero de 15×15
- El jugador puede colocar piedras negras
- Detecta la victoria en cuatro direcciones
- Resalta la línea ganadora
- Lleva el seguimiento del turno y del número de movimientos
- Permite reiniciar la partida
La IA no elige movimientos al azar, sino con un enfoque heurístico
- Explora movimientos candidatos cercanos
- Puntúa patrones ofensivos favorables para sí misma
- Puntúa jugadas defensivas para bloquear amenazas del jugador
- Añade preferencia por el centro
- Selecciona la jugada más fuerte
De forma opcional se puede activar la superposición de AI focus area para ver los puntos candidatos fuertes que la IA consideró
En la etapa de verificación, node --check app.js se completa correctamente
No se ejecutó una prueba interactiva en el navegador, y el paso restante es abrir index.html en el navegador para jugar

Trabajo de larga duración y control externo

ZCode ofrece la función Goals para trabajos de larga duración
- Gestiona planificación, ejecución y verificación continuas en tareas complejas
Con la función Bot control se puede iniciar y ajustar ZCode desde WeChat, Feishu y Telegram
La integración con GLM-5.2 está optimizada para razonamiento, programación y colaboración multiagente en general

Planes y descargas

GLM Coding Plan presenta tres planes
- Lite: para tareas ligeras, $16.2/mes, incluye uso básico
- Pro: para trabajo profesional, $64.8/mes, incluye 5 veces el uso de Lite
- Max: para trabajo de alto uso, $144/mes, incluye 20 veces el uso de Lite
Los precios y beneficios de los planes pueden cambiar, y los detalles finales deben verificarse en z.ai
All Downloads ofrece instaladores por plataforma
- macOS: Apple Silicon .dmg v3.2.2, Intel .dmg v3.2.2
- Windows: 64-bit .exe v3.2.2, ARM64 .exe v3.2.2
- Linux: x64 .deb, x64 AppImage, ARM64 .deb, ARM64 AppImage v3.2.2, marcados como Beta

1 comentarios

GN⁺ 5 시간 전

Opiniones de Hacker News

Me sorprendió un poco que no parezca ser open source. Se compara con Mimo Code https://github.com/XiaomiMiMo/MiMo-Code. La diferencia es que Mimo es una CLI y esto es una app de escritorio.
- Ni siquiera sé qué debería hacer con una app de escritorio. Estas cosas las corro en una VM headless y, si hace falta, con opciones como --dangerously-skip-permissions. Incluso sin ese flag, no confiaría en esto en mi desktop/laptop.
- Que sea CLI se debe a que extrajeron el código de escritorio de opencode. También quitaron el proveedor de modelos Go/Zen de opencode.
  Mi conjetura es que hicieron mucha sustitución de strings para que pareciera rápido un proveedor de primera clase. Aun así, podrían haber vuelto a agregar opencode como proveedor genérico.
- No creo que sea algo sorprendente. El harness se está volviendo tan importante como el modelo base. Hay casos en los que solo con el harness se mejoró casi 2 veces el resultado en benchmarks.
  Creo que el harness se está convirtiendo rápidamente en un componente central del “modelo” en sí. No tiene nada de raro que una empresa que ve una oportunidad de ingresos mantenga el harness cerrado.
- También podrían estar enviando algunas solicitudes de usuarios a Anthropic para recopilar datos transaccionales para su propio modelo. Si ese fuera el caso, quizá tengan que incluir rastreadores de solicitudes que preferirían ocultar.
- Si Anthropic está expresando fuertes preocupaciones por la destilación de Claude y además existe la idea de que el harness es un foso defensivo, tampoco sorprende mucho que la otra parte quiera evitar que se vea qué tan bien lo están haciendo y cuál es su enfoque.
Z.ai tiene documentadas integraciones con casi todos los agentes basados en CLI populares: https://docs.z.ai/devpack/tool/others
Si ya estás acostumbrado a agentes de programación con UI de terminal, no necesitas un agente de escritorio. Aun así, está bien que exista para quienes prefieren el enfoque de UI de Codex App/Claude App.
- El incentivo aquí probablemente sean más tokens. Recuerdo que al usar su propio harness los límites eran más generosos.
- Estoy usando GLM 5.2 en OpenCode y ejecutando CodeNomad dentro de un contenedor Docker con una GUI web. Es accesible desde cualquier lugar y todos los modelos funcionan bien, salvo el modelo de suscripción de Anthropic.
- Es de aplaudir que el equipo de Z.ai haya incluido soporte para Linux desde el primer día.
Se ve bastante bonito. No estoy seguro de si quisiera usarlo en lugar de OpenCode. OpenCode también tiene una app de escritorio y, personalmente, prefiero su UI de terminal. Honestamente, me parece mejor incluso que la UI de terminal de Claude Code. La versión de escritorio es más básica, pero suficientemente buena: https://opencode.ai/download
Dicho eso, es interesante que estén lanzando tantas cosas a la vez desde https://chat.z.ai/, como ZCode, OCR.z.ai, Image.z.ai, Audio.z.ai, AutoClaw, etc. Es una cantidad considerable para que la logre una sola organización.
También probé el plan Pro de coding y, considerando la cantidad de tokens necesaria para terminar una tarea concreta, la cuota no parece muchísimo mayor que la de Opus. Aun así, GLM 5.2 en sí está bastante bien, como un Sonnet más fuerte.
- Su UI de terminal es bastante pesada comparada con Claude Code y crashea con frecuencia.
Me impresiona cómo algunas empresas logran salir adelante usando expresiones como “uso base incluido” [1] o “límites estándar” [2], y luego construyen los planes superiores como múltiplos de ese “base”, pero sin revelar cuál es realmente el valor base.
Parece que el valor base se define según el margen de ganancia de este mes.
[1]: https://zcode.z.ai/en#:~:text=Base%20usage%20allowance%20inc...
[2]: https://support.google.com/gemini/answer/16275805?hl=en#:~:t...
- Al abrir la app sí te muestra el uso base real. Pero los nombres de los planes son distintos a los de la página web.
  Plan Start: 5 millones de tokens al día (3 millones de GLM-5.2, 2 millones de GLM-5 Turbo)
  Para individuos: cuota +150%, USD 18.00+, cuota dedicada del Coding Plan para desarrolladores individuales
- Esto es realmente malo. Nosotros intentamos ser lo más transparentes posible y lo publicamos aquí: https://synthetic.new/rate-limits
- Por eso me gusta la ACCC de Australia. Si fuera una empresa australiana, no les habrían permitido salirse con la suya así.
- Es una estrategia que puede salirles en contra. Una herramienta impredecible es peor que una mala herramienta.
Como alguien que usa GPT-5.5/Codex todos los días, me da curiosidad cómo se comparan GLM-5.2/ZCode en una base de código ya preparada para programación con agentes.
- GLM 5.2 está en una especie de valle incómodo. Es demasiado grande para correrlo en casa y, comparado con modelos de rendimiento similar, es caro y lento. Hay buenos gráficos aquí: https://deepswe.datacurve.ai/
  Eso compara solo precios de API. Si además se consideran las suscripciones de Anthropic y OpenAI, no hay comparación. Con la suscripción Codex de USD 200 fácilmente puedes usar 1.000 millones de tokens por semana en GPT 5.5 high/xhigh.
  Es interesante desde la perspectiva de ser el modelo de pesos abiertos con mejor rendimiento, pero no parece tener un lugar claro en el mercado actual.
- En resumen, GLM hará que las tareas tomen mucho más tiempo y, según la complejidad, también puede consumir más tokens.
  Aun así, como es mucho más barato, me resulta usable. Tengo más experiencia con Claude, pero diría que está casi al nivel de Opus 4.1.
Desde el punto de vista de la UI, parece mucho más cercano a Codex que a Claude Code. En la práctica es una copia exacta de Codex
- Totalmente de acuerdo. El ícono de mano, la forma en que usa el campo de texto y hasta el estilo de la barra lateral son idénticos 1:1 a Codex. El título induce a error. No es cercano a Claude Code
- Por eso se ve todavía más ridículo mantener Codex cerrado. El software ya no es el foso defensivo de nadie. Pueden simplemente soltarlo
Me pregunto si alguien está usando una UI de terminal neutral respecto al proveedor o un harness que permita cambiar de proveedor casi sin fricción para trabajo de desarrollo
Quiero un contexto local del estilo “aquí hay 3 proveedores de IA; usa este para tareas de coding, este para escribir prosa y este para generar imágenes”
- https://opencode.ai/
  OpenCode fue el primer harness de agentes que usé y me siguió gustando. Se pueden configurar varios proveedores, es open source y tiene varios contribuidores principales
  Otra opción es Pi (el harness de agentes Pi). Es una excelente alternativa ligera y soporta varios proveedores. También se puede usar un servidor de modelos local
- Durante los últimos 6 meses he usado tanto Pi como OpenCode, y en ese mismo periodo no he abierto los harness propietarios Claude Code, Codex ni Cursor. Ahora estoy usando Pi, y puedo cambiar sin fricción, en medio de una sesión, a cualquier modelo de cualquier proveedor que quiera. También puedo apuntarlo a un modelo que esté corriendo localmente
  Creo que la gente no se da cuenta de cuánto más cómodo es esto. A mi juicio, Claude Code y Codex dependen por completo del vendor lock-in
- Es posible con role-model, un router de modelos que hice. Enruta según roles, tareas, etc. Tiene una extensión para Pi que permite que el agente de coding especifique metadatos de la solicitud, como rol y capacidades
  https://github.com/try-works/role-model
- Si todavía no lo probaste, vale la pena darle una oportunidad a https://pi.dev
  Llevo meses usando solo Pi y también lo estoy extendiendo: https://a.l3x.in/ai. Uso principalmente GLM-4.7, luego 5.1 y ahora 5.2, y casi no tengo más que pedir
  Todavía estoy puliendo un workflow basado en “Github/Forgejo primero”, pero ya estoy bastante satisfecho. La mayoría de las sesiones se ejecutan como tareas de CI/CD y se disparan con comentarios "/pi" para crear PRs o hacer push de commits a un PR: https://github.com/shaftoe/pi-coding-agent-action
- Escribí una skill para Codex y Claude Code. La idea es designar un orquestador en el árbol de trabajo principal y hacer que no importe qué tipo de trabajador de IA haya en los N árboles de trabajo auxiliares
  Como el orquestador sabe qué cliente de IA está ejecutándose en cada árbol de trabajo, es bastante fácil decidir qué tarea enviar a qué IA
  En cada pestaña de árbol de trabajo ejecuto Claude o Codex. También hay algunas instrucciones específicas para cada UI de terminal de IA; por ejemplo, como Codex tiene un monitoreo rudimentario en comparación con Claude Code, al trabajador de Codex le dejé instrucciones adicionales sobre cómo vigilar correctamente el “correo” nuevo
  Trabajo con el orquestador en el árbol de trabajo principal, y el orquestador delega tareas a los trabajadores y les hace responder preguntas pequeñas. También trae los resultados y, si hace falta, ayuda a limpiar el contexto
  El orquestador y los trabajadores se comunican mediante un sistema de archivos compartido simple bajo tmp/*, y juntos pueden procesar una carga de trabajo grande y variada
  Como uso iTerm2, también agregué un Python específico para iTerm2 que permite al orquestador “despertar” a los trabajadores modificando y enviando la entrada, o hacer que realicen acciones que la UI de terminal bloqueó (/clear, etc.)
Me gustan los modelos open-weight chinos que ofrecen tokens baratos, pero solo los uso para proyectos personales
China tiene historial de robar propiedad intelectual y secretos comerciales, y los tribunales chinos han favorecido a sus propias empresas. En cambio, Estados Unidos tiene tribunales fuertes capaces de hacer cumplir los derechos de propiedad intelectual. Si quieres exponer la propiedad intelectual, los secretos comerciales y los datos de tu empresa al riesgo por unos cuantos tokens baratos, entonces usa los servicios de Z.ai
- Para que conste, los modelos de Z.AI también pueden usarse en infraestructura no china
- Estados Unidos también
La separación entre modelos y herramientas es tan importante como la separación entre el poder legislativo y el judicial. Las herramientas o harnesses que no sean verdaderamente open source deberían simplemente ignorarse. Se meten poco a poco en la vida cotidiana y terminan estrangulándote con vendor lock-in
Creo que es difícil confiar en un sistema de agentes chino de código cerrado.
En la práctica es una caja negra con permisos completos de usuario, así que es como entregarle todo el sistema a servidores de propiedad china. Si usas OpenCode y el proveedor de GLM, al menos puedes monitorear qué archivos leyó, qué archivos editó y qué comandos se ejecutaron.
Además, la Ley de Seguridad Nacional de China obliga legalmente a las empresas a cooperar con los organismos de inteligencia del Estado y las actividades de contrainteligencia [0]. Si instalaste esto en una estación de trabajo corporativa y tu empresa es lo suficientemente grande, la posibilidad de que te vigilen no es solo un riesgo, sino algo casi seguro.
[0]: https://en.wikipedia.org/wiki/National_Intelligence_Law_of_t...
- De acuerdo. Tampoco es fácil confiar en los competidores estadounidenses. Aquí creo que la respuesta es el código abierto.
- Al menos los pesos del modelo están publicados. Yo no soy estadounidense, así que, en todos los aspectos posibles, esto me resulta mucho más confiable.
  Hablan como si las agencias de inteligencia de EE. UU. fueran las buenas, pero al menos para mí no lo son en absoluto.
- Los proveedores estadounidenses son exactamente lo mismo.
- Basta con ejecutarlo en un contenedor bajo Opencode. Funciona muy bien, y yo incluso hice el upgrade al plan Pro (unos $60 al mes). Si quieres usarlo en un contenedor, hay información en el proyecto de mi perfil. Ese código es completamente open source y lo hice porque lo necesitaba para mi trabajo. Seguramente hay muchísimas otras formas.
  Dicho eso, sin importar en qué país esté la empresa, me opongo firmemente a ejecutar cualquier agente en bare metal. En mi artículo trato este punto de forma directa y repetida.
  Hace poco alguien me cuestionó por qué ejecuto software con pocas estrellas, pero no tengo mucho que decir sobre esa lógica. He diseñado y construido sistemas que atendieron a decenas de miles de usuarios. No estoy jugando. La forma en que construyo no es común y tampoco recomiendo a otros imitarla, pero a mí me funciona bien y encaja con mi forma de pensar para manejar sistemas complejos.
  Eres libre de usarlo o no, pero si vas a buscar pelea sin fundamentos sólidos, también deberías estar preparado para que te respondan. He cometido muchos errores durante mi carrera, y creo que asumir la responsabilidad es importante para crecer. Si alguien trae críticas válidas y sustanciales, con gusto puedo trabajar con esa persona para que use mi código.
- Por eso me gusta usar Reasonix con Deepseek. Si entra en caché, la solicitud es prácticamente gratis, y esa ruta también pasa por proveedores estadounidenses sin subsidios como Digital Ocean o Cloudflare.

ZCode: arnés oficial para GLM-5.2

Arnés de desarrollo ajustado para GLM-5.2

Ejemplo de flujo de trabajo

Resultado de la implementación de Gomoku

Trabajo de larga duración y control externo

Planes y descargas

Lecturas relacionadas

1 comentarios

Opiniones de Hacker News