13 puntos por laeyoung 2021-08-02 | 12 comentarios | Compartir por WhatsApp
  • Copilot es un servicio que comercializa Codex, creado sobre la base de GPT-3

  • El entrenamiento se realizó con un conjunto de datos de 159 GB extraído de 54 millones de repositorios en Github

  • Se crearon 164 conjuntos de datos de benchmark, y Codex resolvió el 28.8% de ellos

  • Resuelve bien problemas de algoritmos como los de LeetCode

    -> Se estima que esto se debe a que hay muchos repositorios en Github con soluciones a problemas de algoritmos y aprendió de ellos


En GeekNews ya habían subido varios artículos sobre Copilot.

Esta vez, alguien de la empresa estaba escribiendo un artículo sobre Copilot, y como yo era el único con una cuenta de Copilot Preview, le ayudé un poco desde mi computadora.

Mientras hacía algunas pruebas, lo que más me sorprendió fue que le metí 3 problemas de programación y enseguida salieron respuestas que pasaban directamente.

Uno de los problemas incluso era de Baekjoon, y aunque lo puse después de pasarlo por un traductor, dio la respuesta correcta.

Pensé que también podría haber gente usándolo para hacer trampa en pruebas de programación en línea...

Mi conclusión después de haberlo usado durante un mes integrado en VSCode es la siguiente:

  • Es bueno usarlo cuando desarrollas en un lenguaje o entorno que conoces más o menos.

    -> Estaba desarrollando en React y tenía que hacer algo con e.target.value; apareció una sugerencia de unas 20 letras, presioné Tab para autocompletar y funcionó justo como quería.

    -> Claro, como soy desconfiado, fui a StackOverFlow a verificarlo, y la sugerencia que me dio era correcta.

  • Si ya conoces muy bien el lenguaje o el entorno, las sugerencias pueden no ser óptimas y resultar molestas.

  • Me preocupa un poco si estará bien que el código se envíe para la inferencia, pero también pienso: ¿qué van a hacer solo con el código de cada archivo? Así que simplemente lo sigo usando.

12 comentarios

 
ruinnel 2021-08-03

https://www.youtube.com/watch?v=a9349pRiCRk

También hay opiniones como esta.

Yo vi esto y se me fueron rápido las ganas de interesarme.

 
budlebee 2021-08-03

No sé mucho sobre los derechos de autor del código, pero si tomo código protegido por derechos de autor y solo le cambio un poco cosas como los nombres de las variables o de las funciones para usarlo, ¿eso cuenta como una violación de la licencia?

 
dalinaum 2021-08-05

Sí. Es una infracción.

 
ruinnel 2021-08-03

Más que si el código es completamente idéntico... creo que la pregunta importante en cuanto a derechos de autor del código es: ¿de dónde proviene ese código?

En el caso de licencias MIT o Apache, probablemente no habría mucho problema en tomarlo, modificarlo y usarlo...

Si Copilot recomendó un código idéntico a otro que tiene licencia GPL...

y el desarrollador modificó una parte de ese código y lo incluyó en el proyecto que estaba desarrollando...

entonces, viéndolo desde la licencia GPL, ¿no significaría eso que habría que publicar el código fuente completo de ese proyecto?

Tengo entendido que, si usas código con licencia GPL, no publicar todo el código que hace uso de él constituye una violación de la licencia GPL.

Si lo llevo a un ejemplo extremo e hipotético...

si una empresa está desarrollando una solución, el desarrollador usó Copilot y, con mala suerte, el código recomendado era código de un lugar con licencia GPL que la IA aprendió y escupió tal cual... entonces podría surgir el problema de tener que publicar todo el código de la solución de la empresa.

 
budlebee 2021-08-03

Me da curiosidad: entonces, si el usuario usa código que Copilot generó después de modificarlo un poco, ¿hay alguna forma de detectarlo? Incluso con la misma E/S y la misma funcionalidad, pueden salir códigos con estilos muy distintos, así que me pregunto cómo se detecta ese tipo de plagio de código (¿habrá una metodología para compararlo con una referencia, como en las demandas por plagio musical?).

 
ruinnel 2021-08-03

Pues, no sé muy bien cuál sería el criterio para verificar la similitud ni hasta qué punto se consideraría que es el mismo código jaja

 
laeyoung 2021-08-03

Un artículo relacionado también se publicó en GeekNews

https://es.news.hada.io/topic?id=4659

En ese video de YouTube se habla de derechos de autor, pero viendo que no hay indicación de la fuente ni de los derechos de autor de los materiales mostrados en el propio video (noticias, caricaturas, etc.), parece que realmente es algo muy complicado ;_;

 
ruinnel 2021-08-03

Los derechos de autor de las noticias/cómics del video que usted señaló... sería un asunto del que tendría que hacerse responsable la parte que los usó (la persona que produjo/distribuyó el video), pero...

El problema es qué pasa si, al usar Copilot, se incluye en mi código código que infringe derechos de autor.

Yo solo usé una herramienta, pero al final el programa que desarrollé terminaría envuelto en una demanda por derechos de autor.

 
yeop2 2021-08-02

Yo también quiero probarlo, pero no sé cuándo me lo podrán asignar ;_;

 
ktseo41 2021-08-02

+1, sigo esperando.

 
cog25 2021-08-02

Según entiendo, mientras más uses GitHub, más rápido te lo dan.

 
laeyoung 2021-08-02

Por alguna razón, el año pasado un repo que hice a toda prisa por el COVID terminó recibiendo más de 100 estrellas. No sé si fue por eso, pero tanto con Copilot como con GitHub Codespaces, cuando me postulo suelen seleccionarme sin problema.