El dataroom de Nico enfrenta acusaciones de apropiación de código de Papermark
(twitter.com/mfts0)- Surgieron acusaciones públicas de que el producto de dataroom de Nico no sería un desarrollo propio, sino que parece haber tomado código de la versión open source y de la licencia enterprise de Papermark
- El punto central es si hubo infracción de derechos de autor y de licencia, y quien hizo la denuncia exige que el producto sea retirado de inmediato
- Esto desató una crítica fuerte: no sería un caso de “moverse rápido y romper cosas”, sino algo más cercano a un fraude
- También se señala que esta polémica del producto podría extender las dudas al resto de los negocios de Nico
- Garry Tan, Jared Friedman y Y Combinator fueron etiquetados, por lo que el tema también escala a un posible problema de reputación de la comunidad YC
Acusaciones de apropiación de código de Papermark
- Se hicieron públicas acusaciones de que el producto de dataroom de Nico no habría sido desarrollado internamente, sino que parecería haber tomado código de la versión open source y de la licencia enterprise de Papermark
- Quien plantea el problema considera que es difícil verlo como simple desarrollo rápido de producto o “vibe coding”, y cree que podría haber infracción de derechos de autor y de licencia
- Las exigencias son claras
- La postura es que el producto debe ser retirado de inmediato
- Si la infracción es real, podría interpretarse como una conducta más grave que un simple error
Expansión de las críticas
- Las críticas no se limitan al producto de dataroom de Nico, sino que también ponen en duda la confiabilidad del resto de sus negocios
- Al etiquetar a Garry Tan, Jared Friedman y Y Combinator, el asunto deja de ser una disputa entre personas y se vincula también con la reputación de la comunidad YC
- Con lo que se ha hecho público hasta ahora, el foco está en las acusaciones y las exigencias; no se han aportado verificaciones adicionales ni refutaciones
1 comentarios
Opiniones en Hacker News
Si metes una captura de pantalla de una página web en una herramienta como Figma Make, puedes crear una copia bastante parecida
Justo da esa impresión en las capturas: es muy similar, pero no exactamente igual. Que gran parte del texto sea el mismo probablemente también se deba a eso. Que ni siquiera hayan dejado la reescritura del texto a una herramienta de texto generativa solo demuestra descuido
Viendo otros comentarios en Twitter, probablemente le pidieron a una IA que copiara Papermark
En los comentarios de la IA hay rastros de que la página fue alineada para coincidir con una “reference”
https://xcancel.com/ffumarola/status/2070479755892371713#m
Su respuesta fue esta:
Aunque Nico sinceramente crea que “no copiamos el código” es una defensa razonable, tampoco me sorprendería mucho. Parece el tipo de regla clara que seguiría, y a los perfiles extremos tipo “shape rotator” muchas veces se les dificulta lidiar con zonas grises como las del derecho. En la práctica, la infracción de copyright suele ser como el criterio para identificar pornografía: muchas veces la reconoces cuando la ves
También llegó a afirmar en algún lado que esta empresa o industria es la aplicación más importante de la IA en el mundo. No tengo dudas de que copiaron, y como mínimo no es una persona confiable
https://x.com/nico_laqua/status/2061130574358773852?s=20
Si le hubieran hecho esto a una empresa que sí demanda con frecuencia, habría una posibilidad bastante real de que los demandaran, y yo diría que con probabilidades de ganar de 50/50. Es difícil decir si esto se consideraría copia de elementos creativos o artísticos, o simplemente copia del funcionamiento, pero aunque copiar funciones está bien, copiar toda la experiencia de usuario muy rápido se convierte en infracción de copyright
Y el texto también me parece bastante estándar y predecible para una solución de data room con material real
¿Podrías explicar un poco más el contexto de este hilo? No tengo idea de quién es Nico, qué es Papermark ni qué hace.
Aparte, parece que la gente se está acostumbrando no solo a recrear soluciones o proyectos existentes con vibe coding, sino también a “robar” código open source y usarlo a su antojo sin respetar las premisas morales, éticas y legales del open source. Se siente como si hubiera cada vez más violaciones de open source por todos lados, pero sin grandes consecuencias legales.
Además, muchos de los desarrolladores nuevos que entraron solo por la IA no entienden o no les importa que FOSS no significa gratis como una cerveza, sino libre.
Yo trabajo en una librería GPL3 que parsea archivos de datos binarios de samplers de audio de hardware. Alguien creó una app sobre mi librería para hacer varias tareas, y sí cumplió con la licencia GPL3.
Pero hace poco alguien clonó por completo esa app usando puro vibe coding, y hasta publicó un sitio web y un enlace de compra de unos 60 dólares. Era una copia tan descarada, con exactamente la misma UI y solo colores distintos, y no cumplía en absoluto con las condiciones de la GPL3. Los administradores bajaron la publicación del listado y bloquearon al desarrollador de la app clonada, y la comunidad del foro apoyó al desarrollador de la app original. También enviamos una solicitud de baja por DMCA, y unos días después el sitio de la copia fue dado de baja.
El desarrollador de la app original tuvo suerte porque básicamente solo hay un foro principal donde se publican cosas sobre ese fabricante, y además a los administradores no les gusta el contenido relacionado con IA. Irónicamente, el desarrollador de la app original también hizo todo su trabajo con vibe coding. Sin ese foro y esos administradores, tanto el desarrollador original como yo, que mantengo la librería GPL3, sinceramente habríamos estado fritos.
La centralización tiene sus ventajas. Sin eso, no veo muchas alternativas aparte de que todo el mundo se pase al código cerrado o de que surja un movimiento masivo que obligue a discutir el respeto por el trabajo ajeno. Hasta ahora hemos dependido del sistema de reputación y del rechazo de la comunidad.
Las empresas se están acostumbrando a salirse con la suya hagan lo que hagan. “Muévete rápido y rompe cosas” antes era una frase sobre tecnología, pero ahora se convirtió en una actitud frente a la ley. Uber popularizó esa tendencia y ahora todos hacen lo mismo. Que la IA rompa la ley de copyright también es parte de esa misma corriente.
Por esta forma de pensar de que las nuevas leyes son para los perdedores, parece que se vienen tiempos difíciles.
A estas alturas hay que asumir que, en internet, básicamente todo se volvió algo que cualquiera toma como quiere.
Porque la única forma segura de perder es no participar en el juego.
Papermark es una alternativa open source a DocSend. Puede usarse autohospedada o como servicio hospedado, así que es muy popular porque resulta mucho más rentable que DocSend.
Corgi es una startup de seguros financiada por YC que vende seguros a otras startups de YC. Nico es el fundador. Hace poco levantó 100 millones de dólares con una valuación de cerca de 3 mil millones, y actualmente es una de las empresas que YC más está impulsando.
Como la suscripción de seguros requiere muchísimos documentos, Corgi estaba pagando miles de dólares al mes por DocSend. Por alguna razón, Corgi parece haber armado un equipo de 12 personas para crear su propia alternativa a DocSend, llamada Dataroom. Y Corgi decidió posicionarla como un DocSend más barato, desde 10 dólares al mes, para convertirla en un producto SaaS dentro de un mercado que ya está bastante saturado.
Papermark detectó de inmediato que Dataroom de Corgi usaba mucho del mismo texto y la misma estructura que su producto open source. Por eso concluyó que Corgi tomó trabajo de Papermark sin atribución. Corgi lo niega y dice que las coincidencias palabra por palabra entre ambos productos son simple casualidad.
Otra startup de YC, Delve, sí hizo eso mismo de lo que se sospecha a Corgi, y bastante más; la descubrieron y la expulsaron de YC.
A mí me parece que su lógica se resume más o menos en dos puntos:
Pero la pista más grande aquí es el mismo layout y el mismo texto en ambos productos. Decirle a un LLM “crea este producto y haz una réplica 1:1” sigue siendo copiar según cualquier definición razonable. No tiene sentido afirmar que no se copió nada.
ShadCN es el sistema de diseño más popular, el que la IA elige automáticamente más del 90% del tiempo, y en plataformas como lovable casi funciona como valor predeterminado.
Google copió la API, pero mantuvo la implementación en clean room, y finalmente se dictaminó claramente que eso era uso justo. Si el uso justo aplica incluso a algo tan estricto como la reimplementación de una API, entonces podría aplicarse también a cosas mucho más ambiguas, como copiar una UI o un layout.
No entiendo por qué todavía usan en serio lo que antes era Twitter.
Aunque, como dicen ellos, no hayan copiado y pegado el código directamente, en la práctica puede que el LLM haya reproducido el mismo código a partir de haber rastreado el repositorio y que no se haya respetado la licencia.
Parece un buen caso civil para que lo decida un tribunal. Su defensa suena a algo como: “solo le dijimos al LLM que recreara tu trabajo, así que no fuimos ‘nosotros’ quienes copiamos el código”. Deja un muy mal olor.
La licencia en cuestión: https://github.com/papermark/papermark?tab=License-1-ov-file
Es AGPL, y básicamente significa que incluso si los usuarios interactúan con el software a través de una red, el código fuente debe hacerse público. Los proyectos que usan ese código también deben ser AGPL.
Hay formas de separarlo para esquivarlo. Por ejemplo, usar un servidor de autenticación AGPL no significa que el código con la lógica de negocio también tenga que verse afectado.
Especialmente si hubieran visto controversias pasadas, podrían haber encontrado una forma de diseñar el producto para cumplir con la licencia.
Pero eso asumiendo que realmente se copió el código, y no lo sabemos con certeza. Se ve muy parecido, pero no está claro cómo se haría cumplir
Los problemas de derechos de autor relacionados con estos modelos son realmente un desastre
La industria tecnológica hará lo que sea para normalizar el robo y llamarlo innovación
Un movimiento totalmente típico de una startup de YC