GitHub Copilot agente de codificación, lanzado en vista previa pública

(github.blog)

11 puntos por GN⁺ 2025-05-20 | 2 comentarios | Compartir por WhatsApp

GitHub abrió en vista previa el agente de codificación de Copilot para usuarios de Copilot Pro+ y Enterprise
Permite a los desarrolladores delegar tareas repetitivas y con deuda técnica acumulada a Copilot para enfocarse en trabajo más creativo e importante
Al asignar un issue a la IA, esta realiza automáticamente la modificación de código, ejecución de pruebas y creación del PR
Cuando Copilot termina la tarea, solicita revisión y el desarrollador puede pedir cambios adicionales en comentarios o continuar trabajando directamente en la rama
El trabajo se realiza en un entorno de desarrollo en la nube basado en GitHub Actions, donde también valida por sí mismo que pasen las pruebas y el linter
Los usuarios pueden pedir correcciones a Copilot con comentarios en el PR o traerlo a una rama local para colaborar
Destaca sobre todo en tareas de baja a media complejidad como agregar funciones, corregir bugs y refactorizar en codebases con buenas pruebas

GitHub Copilot coding agent in public preview

Con el agente de código, es posible reducir la deuda técnica y enfocarse en trabajo creativo

GitHub lanzó el agente de codificación de Copilot en vista previa pública, permitiendo delegar a Copilot issues repetitivos o simples
Los desarrolladores pueden asignar issues a Copilot como si fuera un desarrollador más, con soporte en el sitio web de GitHub, la app móvil y el CLI
Copilot analiza el repositorio en su propio entorno de desarrollo en la nube, aplica cambios, ejecuta pruebas y validaciones de lint, y luego crea un PR
Al finalizar, solicita revisión al usuario, quien puede dar retroalimentación con comentarios dentro del PR o continuar trabajando directamente en la rama desde local

Para qué tipo de tareas es adecuado

Copilot destaca en agregar funciones, corregir bugs, ampliar pruebas, refactorizar y mejorar documentación, es decir, tareas de baja a media complejidad
Funciona de forma efectiva en codebases con buenas pruebas, y también permite asignarle varios issues al mismo tiempo

Condiciones de uso y precios

Esta función está disponible en los planes Copilot Pro+ o Copilot Enterprise
En Enterprise, el administrador debe activar previamente la política de “agente de codificación de Copilot” para poder usarla
El uso del agente consume tiempo de GitHub Actions y solicitudes Premium de Copilot
- En particular, a partir del 4 de junio de 2025, cada solicitud al modelo consumirá 1 solicitud Premium

Compatibilidad de plataformas y cómo empezar

Actualmente esta función se está desplegando gradualmente para usuarios de GitHub Mobile (iOS/Android) y GitHub CLI
En la documentación del agente de codificación de Copilot se puede consultar cómo empezar y algunos consejos
Opiniones o preguntas pueden compartirse en la discusión de la comunidad

2 comentarios

wedding 2025-05-20

Lo estoy usando en VSCode Insiders, y como va mejorando poco a poco, resulta sumamente cómodo.
Últimamente incluso ya hace codificación predictiva.

GN⁺ 2025-05-20

Opiniones en Hacker News

Me da la impresión de que Copilot es efectivo para tareas de baja a media dificultad, como agregar funciones, corregir bugs, ampliar pruebas, refactorizar y mejorar documentación, en bases de código bien probadas. Pero la parte importante para los humanos es mantener la cautela al usar IA. Si las pruebas también las genera solo la IA, preocupa que en realidad no funcionen bien. Me gustaría escuchar métricas concretas sobre qué tan exitosamente lo están usando dentro de Microsoft. Microsoft es famosa por usar de verdad sus propios productos (dogfooding), pero siento que es muy difícil distinguir entre un marketing enorme y una utilidad real.
- En GitHub y Microsoft hemos estado usando internamente Copilot coding agent de verdad durante casi 3 meses. A partir de esa experiencia se recopiló mucho feedback y se corrigieron muchos bugs para dejar listo el lanzamiento del agente hoy. Hasta ahora, unos 400 empleados de GitHub han usado el agente en más de 300 repositorios, y se han fusionado casi 1,000 PR con contribuciones de Copilot. En el repositorio donde se desarrolla el agente, Copilot agent es el quinto contribuyente con más aportes. O sea, estamos usando Copilot coding agent para crear Copilot coding agent. (Soy el product lead de Copilot coding agent dentro de GitHub)
- Dentro de Microsoft, da la impresión de que se trata de un despliegue coercitivo impulsado por management. Según un amigo del equipo de Azure, hubo un caso en el que alguien casi termina en un PIP (plan de mejora de desempeño) por negarse a instalar el asistente interno de IA para programar. Cada manager tiene como OKR la cantidad de desarrolladores que usan IA, y muchos desarrolladores tienden a instalarla y casi no usarla. Sobre todo, el soporte para C# y PowerShell todavía es bastante deficiente, así que su utilidad real es limitada.
- De hecho, Microsoft ya ha publicado métricas como la proporción de código generado con IA. Se dice que el 30% del código está siendo escrito por IA.
- Decir que Microsoft era famosa por hacer dogfooding era cierto hasta hace unos 15 años, pero ahora ya no.
Quiero advertir que un problema muy serio de usar Copilot es que el código de repositorios privados podría usarse para entrenamiento. Existen los planes Pro y Pro+, pero en el FAQ solo dice que los datos de Business o Enterprise no se usan para entrenamiento, así que se entiende que los datos de los planes personales de pago sí siguen usándose para entrenar modelos.
- Puede que antes fuera así, pero ahora es diferente. Se puede verificar la política del plan personal en la documentación oficial de GitHub.
- Si programas en entorno Windows, tu pantalla ya se está capturando automáticamente cada pocos segundos, y OCR está analizando todo el texto que aparece en ella. Si no sabías eso, es una noticia impactante.
Probé vibe coding en un proyecto greenfield con Gemini 2.5 pro y cline. Fue bastante impresionante y me ayudó mucho más a la productividad que la interfaz de chat típica de los LLM. Pero si la guía de arquitectura no es lo bastante firme, el LLM tiende a acumular abstracciones equivocadas y deuda técnica (por ejemplo, romper la estructura). No parece tener suficiente autocrítica sobre calidad de código o mejores enfoques. La ventaja es que, si se lo señalo con claridad en el prompt, mejora de inmediato. Y también me sorprendió gastar $15 en tokens de LLM en una sola tarde-noche. Normalmente mi promedio mensual es de unos $20, y nunca me había salido algo así en un solo día.
- Gastar $15 al día en tokens de LLM no es un bug, es una característica. Creo que pronto veremos el fenómeno de la “factura sorpresa de AWS” también en los LLM.
- También recomiendo probar la herramienta Aider y gestionar activamente el contexto con /add, /drop, /clear.
- Si vas a usar Cline con sensibilidad al precio, siento que necesitas gestionar el contexto manualmente. Yo uso Windsurf en su lugar (todavía con Gemini 2.5 pro), y la gestión de contexto es mucho más sencilla.
- En proyectos greenfield, usar IA es incómodo. Hay demasiadas opciones y la IA va cambiando de enfoque. En brownfield (bases de código existentes), puedes darle archivos de referencia para que aprenda patrones de forma natural, y así es mucho más fácil obtener buenos resultados.
- Me interesa evitar la contaminación arquitectónica de los LLM. Espero que el siguiente paso sea la aparición de un linter (basado en IA) que verifique si la implementación coincide con la definición del diseño.
Creo que antes de agregar funciones, deberían optimizar la velocidad. El autocompletado de Copilot es rápido, pero a veces editar un archivo de 100 líneas tarda varios minutos, y eso se siente improductivo. Si tuviera una tasa de acierto cercana al 100%, lo entendería, pero es difícil aguantar esa lentitud con idas y vueltas. Más rápido me resulta abrir otra pestaña con Claude o ChatGPT y copiar/pegar preguntas y código. Cancelé mi suscripción a Copilot y de ahora en adelante me pasaré a modelos locales para autocompletado y tareas simples.
- Mi experiencia es exactamente la opuesta. Editar archivos de varios cientos de líneas se completa en segundos. Parece que antes sí era lento, pero últimamente desaparecieron los cuellos de botella. Incluso usando Copilot con el wifi de una biblioteca, la experiencia es bastante fluida.
- Si tarda minutos, creo que hay un problema serio. La mayoría de los modelos lo resuelven en pocos segundos.
En VS Code alterno entre ChatGPT y Copilot. Se me hizo mucho más fácil entender la sintaxis de Objective-C y, aunque el soporte para librerías es limitado, también creo que no he explorado lo suficiente las librerías de terceros. Los errores de sintaxis y de flujo los detecto de inmediato, así que hago correcciones breves y casi uso el código directamente. Por $10 al mes, esto me hace ver el futuro con optimismo. Tengo muchísimas apps de iOS que debo actualizar, todas de productividad, y además las uso y las vendo yo mismo. Así que el beneficio es doble.
He usado bastante Copilot. Es impresionante, pero también da miedo. El problema importante es que recomienda dependencias aleatorias sacadas de repositorios pequeños sin mucha discriminación, y en muchos casos no son apropiadas para proyectos importantes. Es decir, el usuario tiene que tener cuidado.
- He visto patrones parecidos en varias IA. Le dan demasiada confianza a datos leídos de la web. Por ejemplo, cuando se les pide verificar una estafa de phishing, la IA solo resume el contenido y no hace un análisis confiable. También me ha pasado que recomienden un repositorio chino desconocido con 2 estrellas como si fuera un estándar de la industria, solo porque aparece en el README. Y aunque es un tema aparte, una vez recomendó el protocolo de cifrado "Strobe" y apuntó a strobe.cool, pero ese sitio justamente trata de inducir alucinaciones.
- Gracias por mencionar este fenómeno. No experimenté ese comportamiento durante las pruebas, así que me gustaría investigarlo más a fondo. Si puedes compartirlo por email, sería ideal (mi nick de HN en github.com). Trabajo en el equipo de producto de Copilot coding agent.
- La ejecución de PR funciona con un contexto más confiable en repositorios privados, así que este problema de recomendaciones de dependencias en una situación así sí resulta preocupante.
Me pareció buena la frase “Copilot es fuerte en tareas de baja a media complejidad”. Pero cuando agregan que eso es solo en una “base de código bien probada”, se me van las expectativas.
- Como dijo otro comentario, coding agent es excelente para mejorar la cobertura de pruebas. Y yendo un paso más allá, las herramientas de codificación tipo agente dan mucho más resultado cuando ya existe una buena cobertura de pruebas. Las pruebas ayudan a acotar al agente y le dan oportunidades de verificar por sí mismo su trabajo de forma repetida. No son estrictamente necesarias para este tipo de herramientas, pero si las tienes, el resultado es mejor. (Trabajo en el equipo de Copilot coding agent)
- Si dejas que Copilot escriba todas las pruebas, rápidamente se forma una base de código bien probada.
- En mi experiencia, incluso sin pruebas funciona bastante bien, sobre todo en proyectos greenfield. Aun así, el efecto en actualizaciones y parches es claramente mejor cuando ya existen pruebas.
Ante el eslogan publicitario “¿Te estás ahogando en deuda técnica?”, alguien respondió en tono de broma que mejor se rindan y se hundan. Dice con ingenio que con Github Copilot Coding Agent habrá aún más deuda técnica, se acumulará una nueva deuda técnica de la que nadie sabrá quién es responsable, y que sus compañeros pronto terminarán igual.
Un amigo mío participa en el proyecto relacionado en GitHub, y llevo días escuchando solo sobre esta noticia. Me repitió hasta el cansancio que tenía que ver sí o sí el keynote del lunes. Después del tercer timeout de autenticación abandoné el streaming, pero si hubiera sabido que era sobre este tema, creo que lo habría intentado una vez más.
- Me da curiosidad saber específicamente de qué keynote hablan. Hasta ahora no aparece mucho ni buscando.
- Un consejo: mejor vayan directo a YouTube y se ahorran el proceso de registro de MS.
- Siempre escucho con cautela lo que dicen los programadores en activo, porque el marketing interno viene muy cargado. Espero que supere por mucho a competidores como Cursor, y pienso ver la demo en vivo.
En los inicios de los LLM, hice mi propio agente usando github actions y el workflow de issues. Tenía funciones limitadas, pero bastaba con asignarle un bug para que ejecutara automáticamente tareas como aplicar cambios, resolver tareas de arquitectura/edición, verificar modificaciones y al final enviar un PR. Ahora me entusiasma poder usar algo similar como herramienta oficial (muestra de mi trabajo: chota).