1 puntos por recast7838 4 시간 전 | 1 comentarios | Compartir por WhatsApp

Moonshot AI lanzó 'Kimi K2.7-Code', un modelo de codificación centrado en agentes con un rendimiento de programación ampliamente mejorado frente al modelo anterior y un 30% menos de consumo de tokens de razonamiento.


Traducción completa

Esta semana, Moonshot AI lanzó Kimi K2.7-Code, un modelo centrado en agentes especializado en programación. Los pesos del modelo se distribuyen en Hugging Face bajo una licencia MIT modificada. También puede usarse a través de Kimi API y Kimi Code. K2.7-Code está orientado a tareas de ingeniería de software de largo plazo, no a conversaciones generales. El modelo planifica en múltiples pasos, modifica código, ejecuta herramientas y realiza depuración. Moonshot AI lo ofrece en conjunto con su plataforma de programación por suscripción.

Especificaciones de Kimi K2.7-Code

K2.7-Code es un modelo MoE (Mixture-of-Experts). Tiene un total de 1T parámetros, de los cuales 32B se activan por token. Esta arquitectura selecciona 8 expertos por token de un total de 384 expertos, con 1 experto compartido. Está compuesto por 61 capas en total, incluida 1 capa densa.

En el mecanismo de atención se usa MLA, y en la ruta feedforward se aplica SwiGLU. El codificador de visión MoonViT agrega 400M parámetros para entradas de imagen y video. El modelo se ofrece con cuantización INT4 nativa. La ventana de contexto es de 256K tokens (262,144). Hay dos restricciones. El modo Thinking es obligatorio, y si se desactiva, la API devuelve un error. Los parámetros de muestreo están fijos en temperature 1.0, top_p 0.95, n 1 y penalty 0.0. La salida máxima predeterminada es de 32,768 tokens. Puede autoalojarse con vLLM, SGLang y KTransformers. El repositorio de Hugging Face es muy grande, con alrededor de 595GB en disco. Está claramente dirigido a despliegues de nivel servidor, no a un modelo para laptop.

Puntajes de benchmark

El equipo de Moonshot publicó resultados en 6 benchmarks. Compararon K2.7-Code con K2.6, GPT-5.5 y Claude Opus 4.8. K2.7-Code superó a K2.6 en todos los apartados. La mayor mejora en programación se vio en Kimi Code Bench v2, donde subió de 50.9% a 62.0%.

K2.7-Code registró 81.1% en el benchmark MCP Mark Verified, superando el 76.4% de Opus 4.8. También obtuvo una cifra cercana a GPT-5.5 en MLS Bench Lite. K2.7-Code se ejecutó en Kimi Code CLI, mientras que GPT-5.5 se probó con Codex xhigh y Opus 4.8 en el entorno Claude Code xhigh.

1 comentarios

 
cnaa97 1 시간 전

Impresionante, de verdad