Kimi K2.7 Code ya está disponible oficialmente en GitHub Copilot

(github.blog)

1 puntos por GN⁺ 22 시간 전 | 1 comentarios | Compartir por WhatsApp

Kimi K2.7 Code se suma a GitHub Copilot y se convierte en el primer modelo de pesos abiertos que se puede elegir en el selector de modelos
GitHub lo aloja en Microsoft Azure, ofreciendo más opciones de modelos y alternativas de menor costo para flujos de trabajo de programación
La facturación se aplica según el precio de lista del proveedor dentro del esquema de pago basado en uso; para conocer el costo real, se debe consultar la documentación de precios de modelos y solicitudes de Copilot
Se desplegará gradualmente primero en los planes Copilot Pro, Pro+ y Max, y estará disponible desde el selector de modelos de Visual Studio Code
En Copilot Business y Enterprise viene desactivado de forma predeterminada, por lo que antes de usarlo en una organización se requiere que un administrador habilite la política y revise los aspectos de seguridad, cumplimiento y gobernanza de datos

El primer modelo de pesos abiertos agregado a Copilot

Kimi K2.7 Code es un modelo de pesos abiertos disponible oficialmente en GitHub Copilot
Se agregó como el primer modelo de pesos abiertos que se puede seleccionar desde el selector de modelos de Copilot
Ofrece más opciones de modelos y alternativas de menor costo en los flujos de trabajo de programación
GitHub aloja el modelo en Microsoft Azure

Facturación basada en uso

Kimi K2.7 Code se cobra según el precio de lista del proveedor dentro de la facturación basada en uso
Los criterios detallados de facturación se pueden consultar en la documentación de GitHub Copilot’s pricing for models and requests

Alcance de disponibilidad dentro de Copilot

Kimi K2.7 Code se implementará primero de forma gradual en los planes Copilot Pro, Pro+ y Max
Los usuarios podrán elegir este modelo desde el selector de modelos de Visual Studio Code
El despliegue se realizará por etapas, y GitHub seguirá monitoreando la calidad y el rendimiento del modelo
Durante las próximas semanas, se ampliará a Copilot Business, Enterprise y a pantallas de uso adicionales

Clientes y pantallas compatibles

El selector de modelos está disponible en los siguientes entornos
- Visual Studio Code 1.127.0 o superior
- Visual Studio 17.14.6 o superior
- Copilot CLI
- GitHub Copilot cloud agent
- GitHub Copilot App
- github.com
- GitHub Mobile iOS y Android
- JetBrains 1.9.1-251 o superior
- Xcode
- Eclipse

Configuración de administrador para Business y Enterprise

Kimi K2.7 Code está desactivado de forma predeterminada en Copilot Business y Copilot Enterprise
Para que los miembros de una organización puedan seleccionar el modelo, un administrador del plan debe habilitar la política de Kimi K2.7 Code en la configuración de Copilot
Si la política permanece desactivada, el modelo no podrá usarse en esa organización
Se recomienda que los administradores revisen antes de habilitarlo si el modelo de pesos abiertos cumple con sus propios requisitos de seguridad, cumplimiento y gobernanza de datos

Documentación y canales de feedback

La lista completa de modelos disponibles en GitHub Copilot se puede consultar en la documentación de supported models
La selección del modelo adecuado para cada tarea se puede consultar en la documentación de choosing the right AI model for your task
El feedback se puede compartir en la discusión de GitHub Community

1 comentarios

GN⁺ 22 시간 전

Opiniones de Hacker News

Ya perdí casi todo el interés en los productos de IA basados en la nube.
Me cansé de que tantas funciones y flujos de trabajo geniales que alguna vez esperaba con entusiasmo se volvieran difíciles de usar por varios motivos, como aumentos de precio, la sensación de menor rendimiento, cierres de servicios, reemplazos, etc.
Armé un equipo pequeño y prácticamente me quedé con Qwen3.6, y estoy agregando poco a poco por mi cuenta las funciones que necesito. No sé si está al nivel de competir con Claude, y dejé de comprobarlo. Ahora mismo ya me aporta mucho valor y sigue mejorando, y me gusta que, aunque el pasto pueda ser más verde en otra parte, no cambia bajo mis pies.
- Me alegra que este sea el comentario principal. Yo también lo uso completamente en local.
  Quiero dejar dicho que, para quienes no tienen memoria para correr modelos grandes de 32 GB, los modelos podados también rinden bastante bien. Si tienes una máquina chica, vale la pena probar el modelo cuantizado Q4 de unsloth podado de GLM 4.7 Flash, que entra en 14 GB: https://huggingface.co/unsloth/GLM-4.7-Flash-REAP-23B-A3B-GG...
  Normalmente uso LM Studio para este tipo de cosas, pero unsloth también tiene su propia app de estudio, que podría ajustarse mejor a estos modelos cuantizados. Usé GLM 4.7 Flash como modelo principal durante varios meses y fue muy persistente y muy rápido; con hardware limitado, parece una buena opción.
- Qwen3.6-35B-A3B-UD-Q4_K_M corre a unos 11 tokens por segundo incluso en mi vieja 1060. Es realmente absurdo hasta dónde hemos llegado.
- Últimamente, el avance de la IA me da la impresión de consistir sobre todo en empujar diferencias de fine-tuning.
  Por ejemplo, el nuevo Claude está ajustado para programación de tipo agente y eso puede ser perjudicial para la programación no agéntica; Fable 5 se ve bien, pero tiene un alto costo de inferencia y es muy probable que después del lanzamiento sufra una baja de rendimiento o cambios en límites y precios. Gemini 3.5 tiene límites más generosos, pero rinde un poco menos.
  Salen nuevas versiones y suben los números, pero me pregunto si todos esos cambios son realmente avances o solo un ajuste distinto con un rendimiento por dólar similar al de principios de año. Los cambios reales se ven más en modelos pequeños como Qwen o Gemma 4 31B, y si además se considera la capacidad multilingüe, resultan bastante mágicos.
  Justo antes de publicar vi una comparación del antes y después de Fable, y la versión reintroducida sufrió una caída desastrosa en BridgeBench porque siguen tocando el modelo: https://x.com/Hesamation/status/2072692225100612032
- Suena bastante atractivo; para hacer algo así, ¿qué configuración de Mac mini haría falta?
- Yo también monté Qwen3.6 en una vieja MBP y lo estoy usando con satisfacción.
  No es tan rápido como Claude, que uso en la empresa, pero corre lo suficientemente bien en local, y no tengo que preocuparme por cosas como que de repente se acaben los créditos o desaparezcan funciones.
Me gusta mucho Copilot CLI. Lo siento más lógico y con menos fricción que Claude Code.
También me gusta poder alternar libremente entre varios modelos. Por ejemplo, algo como “armar el plan con Opus 4.6, validar ese plan con GPT 5.4 y recibir feedback, y luego implementarlo con Sonnet 4.6”.
Pero por el cambio de precios de Copilot en junio, tanto yo personalmente como todo el departamento de mi empresa tuvimos que pasarnos a Claude Code. En abril y mayo apenas superábamos un poco los créditos incluidos y gastábamos unos pocos dólares extra, pero desde junio nos acabamos el presupuesto mensual cada 2 o 3 días.
Desde el punto de vista del cliente, fue un aumento de precio completamente demencial y no sé qué estaba pensando Microsoft. Aunque ese precio fuera necesario para la sostenibilidad, deberían haber esperado a que la competencia cambiara primero sus precios. No me sorprendería que el mes pasado hubieran perdido a más del 50% de sus clientes de Copilot.
Si al final todos los proveedores principales convergen en estos niveles de precios, quizá el Estado tenga que operar una IA de acceso público, como la televisión. Algo así como usar modelos abiertos gratuitos y operar algunos centros de datos con impuestos, con restricciones regionales y throttling estricto, pero permitiendo a estudiantes y ciudadanos usarlos libremente.
Si dentro de unos años todos los precios de IA llegan al nivel de Copilot, solo podrán usarla las empresas unicornio, y el resto no tendrá oportunidad de competir contra las compañías que sí usan IA.
- Dices que deberían haber esperado a que la competencia cambiara sus precios, pero en cierto modo eso ya pasó.
  Literalmente están trasladando el costo: https://platform.claude.com/docs/en/about-claude/pricing
  Anthropic también ofrece suscripciones, pero las empresas normalmente no quieren usarlas, porque lo que se envíe por esa vía puede usarse para entrenamiento o convertirse en parte del modelo.
  Si lo usas sin permiso explícito de tu empleador, podrías estar violando el contrato, y si te demandan las consecuencias podrían ser graves.
- El aumento de precio fue una locura. La empresa donde trabajo también se está pasando de Copilot a suscripciones de Claude Code.
  Al mismo tiempo, estamos probando AWS Bedrock y Deepinfra para modelos de pesos abiertos, por si Claude Code termina dejando de ser una buena oferta y se ajusta a los costos reales de tokens.
- Por primera vez en meses agoté mis créditos de Claude en el trabajo y volví a Copilot, y sorprendentemente estuvo bien.
  Claude está muy por delante en cuanto a herramientas, pero la asignación de modelo por subagente y el acceso a todos los modelos son funciones mejores que todo lo que Claude ofrece actualmente en conjunto.
  Como el único límite a la cantidad de IA que puedo consumir en la empresa por mes son los dólares, lo que me reduzca el costo es para mí el mejor modelo y entorno de ejecución. Copilot también fue mejor asignando automáticamente modelos más adecuados a los subagentes, mientras que Claude a menudo usa modelos más caros.
- Pregunto en serio: ¿podrías explicar más en qué partes sientes que Copilot CLI es mejor que Claude Code? Cuando tengo opción uso OpenCode, pero me interesa saber qué hace que prefieras Copilot CLI.
- La estrategia de dejar que el modelo se elija automáticamente ya no es sostenible.
  Aun así, hay modelos eficientes capaces de ejecutar planes creados por modelos mejores. Da un poco de vergüenza pensar que la selección automática de modelos de Microsoft, con su antigua estructura de precios que daba pérdidas, elegía modelos de razonamiento de punta para tareas como resolver conflictos de dependencias.
Usaba GitHub Copilot para desarrollar VS 2026 y alternaba entre ChatGPT y Claude; eso fue antes de conocer Claude Code y la app Codex
Copilot me servía bien para mi uso y con 10 dólares al mes alcanzaba
Pero cuando el mes pasado introdujeron el nuevo modelo de precios, esos 10 dólares se agotaron en pocos días. Entiendo que el precio anterior no era sostenible, pero por eso me pasé a Claude Code y Codex, y no miré atrás. Los tokens de Claude Code y Codex también están fuertemente subsidiados, pero hay que disfrutarlo mientras dure
Se siente una diferencia entre usar Claude a través de Copilot y usar Claude directamente en Claude Code. No sé qué hace Microsoft por detrás
- El entorno de ejecución es muy importante. Las herramientas disponibles y el prompt de sistema varían según el entorno de ejecución
  Anthropic está un poco adelante tanto en el entorno de ejecución como en el modelo, así que tiene lo mejor de ambos mundos
  Del lado de Microsoft probablemente sea el mismo modelo, pero las herramientas y prompts alrededor parecen peores, y por eso los resultados también empeoran
- Me pasó algo parecido al dejar Copilot dentro de Zed
  Ahora uso el entorno de ejecución reasonix para DeepSeek, y cuando hay aciertos de caché el costo es casi gratis. Incluso usando proveedores estadounidenses sin subsidios como Digital Ocean o Cloudflare
- Yo también me pasé a Cursor. Le indiqué cómo invocar msbuild y edita por su cuenta incluso sin un plugin nativo de Visual Studio
  El lenguaje objetivo es C++ y no hay problema
- En las últimas semanas el costo de GitHub Copilot aumentó mucho; algo que antes costaba 100 dólares ahora requiere 300
  Me gusta usar Claude en VS Code a través de Copilot, y siento que da mejor código porque puedo controlar mejor la calidad del código. Es mucho más transparente que Claude Code, es open source y la interfaz del IDE da más control sobre el contexto y los artefactos generados
  El aumento de costo no se debe solo al alza de precios; también influye que el agente del modelo Opus usa más tokens. Por eso me pasé a Claude Code y sigo usando Opus 4.6 con satisfacción. Fable y 4.7 tienden a desviarse y a inventar supuestos cuando trabajan en unidades más grandes, así que el resultado queda desprolijo
- Con Claude 4.8 Opus, la cuota de Copilot probablemente se me acabó en apenas 2 o 3 prompts. Esperaba que fuera malo, pero no tanto. Fue bueno mientras duró
Por fin apareció una alternativa de un proveedor grande que las empresas pueden usar
La gente quería una forma de ejecutar modelos chinos en un proveedor confiable, y GitHub la está ofreciendo
Si creemos en los benchmarks, el rendimiento está al nivel de Sonnet 4.6. Habrá que ver si vale la pena al precio de GitHub
- Como Microsoft cambió a cobro basado en tokens, tiene que ofrecer opciones más baratas
  GPT-5.4 era 1x para suscriptores anuales y ahora es 6x. Las solicitudes premium se agotan en unos pocos prompts. GitHub Copilot de 10 dólares al mes antes era la mejor relación precio-rendimiento porque permitía usar barato modelos de laboratorios de IA de EE. UU.
- No confío en los benchmarks. Probé Kimi K2.7 varias veces y me decepcionó
  Dio vueltas para hacer algo que Claude resuelve de una sola vez. Eso sí, mi ruta de uso fue Ollama Cloud, y no sé si ofrecen el modelo real o una versión cuantizada; la cuantización podría haber degradado el rendimiento
  Aun así, la buena noticia es que ya existe un precedente. Si Microsoft ahora ofrece Kimi K2.7, pronto también podría ofrecer GLM 5.2, que sí es un modelo muy competitivo
- Puede que vuelvan a llamarme promotor, pero es relevante, así que no me importa
  Synthetic opera sus propios modelos, incluidos GLM5.2 y Kimi K2.7-Code, a precios razonables
  Enlace de referido: https://synthetic.new/?referral=kwjqga9QYoUgpZV
Entrada: 0.95 dólares, acierto de caché: 0.19 dólares, salida: 4.00 dólares
Es el mismo precio que cobra Moonshot, y está más o menos en el rango de precio de GPT 5.4 mini, así que no es una mala opción
Como ejemplo de un prompt tonto que desperdicia tokens por contexto: “Juega tic-tac-toe solo en un tablero de 5x5. Ganas si colocas 5 en línea.”
En Kimi K2.7 cuesta 0.006 dólares y se puede ver toda la traza de razonamiento en bruto. GPT-5.4 mini cuesta 0.016 dólares y viene resumido
Por si tienen curiosidad, ambos juegan de forma increíblemente tonta
Kimi:

A B C D E
1 . . . . .
2 . . . . .
3 X X X X X
4 . O O O O
5 . . . . .

GPT 5.4 mini:

1: X X X X X
2: O O . . .
3: . . O . .
4: . . . O .
5: . . . . O
- Como dato, para quien tenga curiosidad: GPT 5.5 también hace la misma jugada basura que 5.4 mini, pero cuesta 4 veces más
  Fable genera una partida plausible por 40 centavos
  
  X X O O O
  O O X X X
  X X X O O
  X O O X O
  X O X X O
- Buena idea. Probé pedirle lo mismo a Haiku en Claude Chat para iOS, y creó un juego interactivo en React, implementó las reglas y me hizo jugarlo directamente
  Movimiento inteligente para 1 dólar de entrada y 5 dólares de salida, Anthropic!
- Los modelos de lenguaje grandes son flojos para los juegos, pero sí pueden escribir un agente de aprendizaje por refuerzo que aprenda el juego en sí
- Si me aburro muchísimo, pienso hacer que dos modelos jueguen ajedrez entre sí
  Me imagino que en algún lado ya debe existir un benchmark de ajedrez o un torneo de modelos de lenguaje grandes
Es raro que AWS Bedrock dé un soporte tan pobre a estos modelos.
Solo están Kimi 2.5, qwen 3 coder, DeepSeek V3.2 y GLM 5 más o menos; no hay modelos recientes.
- Me pregunto si es una decisión de producto o una limitación de GPU.
  Las instancias Inf2 necesitan AWS Neuron [1]. También puede ser que portar el modelo para que funcione en ese hardware tome demasiado tiempo.
  [1] https://aws.amazon.com/ai/machine-learning/neuron/
Definitivamente es mucho más barato de ejecutar que otros modelos, y lo probé ayer durante más o menos una hora; los resultados se veían prometedores.
Vi en una discusión de Reddit que el equipo está evaluando glm5.2, así que espero que agreguen más.
¿GitHub Copilot es el mejor posicionado como plataforma para empresas?
Soporta Claude, GPT, Gemini y ahora hasta modelos de pesos abiertos. Las organizaciones grandes, de todos modos, pagan a nivel de tarifas de API, así que el costo es parecido sin importar dónde lo usen.
Tiene una CLI de agentes y un SDK bastante buenos, y ahora también una app de escritorio. También tiene agentes alojados, y se pueden ejecutar “Agentic Workflows” en CI.
¿Será que su reputación cayó tanto que solo se presta atención a las alternativas? ¿O que los usuarios no empresariales quedan desplazados por los costos de uso y por eso no genera marketing gratis?
- El rug pull de cambiar los precios sin aviso previo no cayó bien en el sector empresarial.
- Cancelamos los planes de todos y desplegamos liteLLM internamente.
  Mantuvimos Copilot porque los tokens eran absurdamente baratos, pero después del cambio de precios se volvió un servicio parecido a openrouter, solo que con muchos menos modelos.
- Antes sí lo era, pero ya no desde que decidieron matar su propio servicio.
- Por alguna razón, Copilot se siente más tonto que Claude en VS Code o Codex en VS Code.
  No sé la razón exacta, pero no me dejó una buena sensación.
- El entorno de ejecución de Copilot es pésimo comparado con otros entornos de ejecución basados en CLI que uso para pruebas comparativas. Sorprendentemente malo.
  En la empresa este tema sale seguido, porque los responsables de gestión de proveedores no entienden el ecosistema de los modelos de lenguaje grandes y creen que Claude a través de Copilot y Claude a través de Claude Code son lo mismo.
  Cada vez que me piden explicar la diferencia, una comparación simple lado a lado muestra un rendimiento drásticamente inferior en 3 o 4 de cada 5 casos.
Si son un equipo pequeño que quiere probar Copilot, les advierto que pueden perder horas peleándose con la configuración de facturación siguiendo documentación vieja.
En resumen, al final recibimos un correo de GitHub diciendo que “Copilot Business está disponible para equipos que compren 10 licencias o más”. No está documentado, pero a otros también les está pasando lo mismo: https://github.com/orgs/community/discussions/199346
Por ahora vamos a quedarnos con Cursor y usar Kimi como principal bajo el nombre “Composer”.
Por fin salió. ¿Este es el primer LLM de pesos abiertos de Copilot? Es como si se hubiera abierto la puerta.

Kimi K2.7 Code ya está disponible oficialmente en GitHub Copilot

El primer modelo de pesos abiertos agregado a Copilot

Facturación basada en uso

Alcance de disponibilidad dentro de Copilot

Clientes y pantallas compatibles

Configuración de administrador para Business y Enterprise

Documentación y canales de feedback

Lecturas relacionadas

1 comentarios

Opiniones de Hacker News