56 puntos por GN⁺ 2025-08-27 | 1 comentarios | Compartir por WhatsApp
  • DeepWiki es una herramienta que permite ver cualquier repositorio de GitHub convertido al instante en una wiki explorable
  • Con modo Fast / Deep Research y funciones como citas a nivel de línea, ofrece respuestas confiables para explorar código, configurar entornos y analizar diseños en distintos escenarios de desarrollo
  • Se integra con el servidor MCP y puede usarse de forma natural con los principales AI IDE como Claude y Cursor
  • Mejora notablemente la productividad en todo el flujo de trabajo de desarrollo, incluyendo evaluación técnica, revisión de ejemplos de implementación, contribuciones open source y revisión de PR
  • Con DeepWiki, se puede reducir de forma importante el tiempo necesario para entender código y mejorar la eficiencia del onboarding y las revisiones

Introducción y resumen de la herramienta

  • DeepWiki es una herramienta para explorar repositorios de GitHub creada por el equipo de Cognition (el mismo que desarrolló Devin AI Engineer)
  • Basta con cambiar github.com por deepwiki.com en la URL del repositorio para usar de inmediato una wiki generada automáticamente y navegable
  • Permite maximizar la eficiencia en escenarios como bases de código desconocidas, evaluación de open source, implementación de funciones avanzadas y onboarding de nuevos integrantes al equipo
  • En lugar de leer o buscar código manualmente, se puede comprender la estructura y el funcionamiento a partir de preguntas

Cómo funciona DeepWiki

  • DeepWiki admite repositorios públicos y privados con una cuenta gratuita de Devin
    • En los repositorios públicos se puede preguntar de inmediato, mientras que para los repositorios privados se requiere una cuenta de Devin
  • El modo Fast responde al instante usando un grafo de código, mientras que el modo Deep Research lee varios archivos para ofrecer respuestas de alta confiabilidad
  • Todas las respuestas incluyen citas clicables del código fuente, lo que permite ir rápido a la ubicación real y ayuda a evitar resúmenes incorrectos o alucinaciones

Cómo usar DeepWiki

Uso desde el sitio web o desde un AI IDE

  • Puedes pegar una URL de GitHub en deepwiki.com o integrarlo directamente en un AI IDE (Claude, Windsurf, Cursor, etc.) mediante el servidor MCP oficial de DeepWiki
  • El servidor MCP puede usarse sin autenticación; solo hay que agregarlo a la configuración del IDE para convertir a DeepWiki en un asistente de consultas siempre activo
  • Como permite consultar y preguntar en cualquier momento sobre el contexto y la estructura de la base de código, mejora mucho la productividad de desarrollo

Casos de uso reales

  • 1. Evaluación de proyectos open source

    • Antes de usar una nueva librería open source, permite verificar de inmediato aspectos clave como mantenimiento, seguridad y licencia
    • También guía con ubicaciones exactas del código y enlaces a archivos de configuración, llamadas de red y cláusulas de licencia para tomar decisiones con rapidez
  • 2. Configuración de un nuevo entorno de desarrollo

    • Ante preguntas como “¿cómo se ejecuta en local?”, ofrece rápido métodos de configuración, grafo de dependencias y scripts relacionados, junto con citas al contenido original
    • Hace referencia automática a README, Dockerfile, scripts y otros archivos, lo que reduce considerablemente la carga de la configuración inicial
  • 3. Reutilización de ejemplos de implementación

    • Permite aprovechar detalles de implementación como flujos de autenticación particulares o mecanismos de persistencia de estado a través de resúmenes en Markdown
    • Ejemplo: analizar con DeepWiki una estructura de control de múltiples coding agents usando tmux y aplicarla en un proyecto propio
  • 4. Guía de onboarding personalizada

    • Para preguntas concretas y contextuales como “explica el flujo de reintentos del procesador de colas”, entrega orientación detallada como la de un desarrollador senior junto con enlaces al código
    • Esto permite obtener rápidamente material de onboarding adaptado al usuario
  • 5. Exploración de la primera contribución

    • Al contribuir a un equipo nuevo o a un proyecto open source, puede buscar automáticamente good first issues
    • También sugiere puntos de entrada fáciles para principiantes como TODOs, pruebas fallidas o documentación incompleta
  • 6. Uso con repositorios estilo cookbook

    • En repositorios centrados en ejemplos como Anthropic Cookbook o Gemini Cookbook, permite encontrar y generar rápidamente los ejemplos y fragmentos de código deseados
  • 7. Construcción de agentes de código con reconocimiento de contexto

    • Cuando se necesita entender el contexto general del código, la arquitectura y el estilo de programación, genera automáticamente la información necesaria
    • Al integrarse con herramientas como Sidekick Dev, puede generar automáticamente archivos de contexto (cursorrules.md, claude.md, etc.) para mejorar el uso de agentes de código
    • Con la API MCP gratuita de DeepWiki, también se habilitan múltiples aplicaciones como onboarding, generación de pruebas y AI pair programming
  • 8. Revisión rápida de Pull Requests

    • Cuando un compañero abre un PR, DeepWiki puede generar de inmediato un resumen estructurado de los cambios para revisar más rápido y entender el contexto
    • No solo ayuda a identificar cambios puntuales, sino también a comprender su ubicación e impacto dentro de toda la base de código, contribuyendo a una revisión más eficiente

Cuándo conviene usar DeepWiki

  • Al explorar stacks poco familiares, componentes que no ves desde hace tiempo o repositorios públicos complejos, DeepWiki debería ser la herramienta prioritaria
  • En lugar de hacer búsquedas con grep, puedes seguir el flujo de explorar el resumen tipo wiki → hacer algunas preguntas de seguimiento → saltar directo a los archivos de interés para lograr un onboarding más rápido

Qué me gustaría ver en DeepWiki

  • 1. Modo sidekick interactivo – Tener DeepWiki siempre abierto junto al IDE y poder hacer preguntas específicas en tiempo real, como dónde se llama una función
  • 2. Onboarding orientado a objetivos – Si se ingresa un repositorio y un objetivo (por ejemplo, corregir un issue abierto), que ofrezca una ruta paso a paso con los archivos, funciones y comandos necesarios

Conclusión y recomendación de uso

  • DeepWiki puede usarse directamente en http://deepwiki.com
  • Es una herramienta muy recomendable como solución de entendimiento de código y onboarding en distintos entornos de desarrollo

1 comentarios

 
GN⁺ 2025-08-27
Comentarios en Hacker News
  • Es una lástima que no haya una forma clara de solicitar la eliminación; no queríamos que se generara este tipo de información incorrecta sobre documentos de LibreOffice, y aun así encontramos lo siguiente en deepwiki: https://deepwiki.com/LibreOffice/core/2-build-system (nota: LibreOffice nunca ha usado un sistema de build llamado Buck)

    • Por curiosidad pregunté esto: LibreOffice tiene archivos como .buckversion, BUCK y .buckconfig, y en este commit se ven rastros de uso de Buck; aunque fue hace 10 años, me da curiosidad si hubo algún contexto histórico en el que se adoptó Buck, aunque fuera brevemente

    • Le envié a deepwiki una solicitud cortés con tono legal y respondieron de inmediato para sacar mi proyecto del índice

      Hola, me pongo en contacto con ustedes por la seguridad y la protección de los usuarios del software de código abierto
      Quisiera saber cómo puedo evitar que deepwiki indexe proyectos dentro de mi organización de GitHub
      Si ustedes creen que tienen implícitamente autoridad legal para entrenar y redactar sobre mis proyectos, por medio de esta notificación declaro que retiro esa autoridad de forma explícita y permanente
      Si hace falta, también les informo que, si en el futuro deepwiki publica información incorrecta sobre mi proyecto, eso podría considerarse difamación intencional
      Como los LLM no tienen voluntad propia, la publicación de información incorrecta depende por completo de la voluntad humana
      Gracias
      Conrad Buck

    • En mi experiencia real usándolo, los resultados que produce deepwiki no eran basura engañosa

  • No quiero criticar a Deepwiki a ciegas; ciertas partes (especialmente los diagramas del sistema) son bastante impresionantes y se siente que ahorran tiempo
    Pero me decepciona que, aunque las libs que mantengo no sean tan populares, sí tienen millones de descargas al año, y aun así la documentación generada por deepwiki suele ser incorrecta, lo que al final da un mal resultado para los usuarios

  • La herramienta DeepWiki en sí me parece bastante buena
    También me parece bien ese intento de reunir en un solo lugar la documentación dispersa por todo el codebase, e incluso tratar de completar lo que no existe con cierta predicción
    Creo que es un ejemplo de automatización de asistencia de código que está un nivel por encima de las herramientas auxiliares existentes del tipo “el tipo de este elemento es <X>, aquí está la explicación”
    Parte de la información sí puede ayudar bastante con automatización, pero a veces la perspectiva humana es indispensable
    Estoy de acuerdo con el consejo de “hay que tratarlo como si fuera un ingeniero senior experimentado”
    Los LLM son confiables en cuanto a paciencia (responden incluso preguntas tontas sin cansarse), pero es difícil esperar que actúen como un senior de verdad
    Si no se lo pides, no suelen cuestionar ideas tontas ni proponer otras mejores
    Y si les pides “contradíceme a la fuerza”, también tienden a rebatir más de la cuenta

    • Estoy probando deepwiki con un repositorio sin comentarios ni documentación de ningún tipo
      Me pareció interesante que, incluso después de esperar más de 10 minutos, no pasó nada; como es un proyecto del lenguaje Lingo source, parece que deepwiki ya se rindió

    • Siento que DeepWiki ya aporta un valor grande
      Mantengo proyectos open source, y suelo recomendárselo a voluntarios para que exploren codebases complejos
      Pero también me ha pasado varias veces que DeepWiki inventa cosas bastante convincentes sobre struct/paquetes/funciones cuyo nombre sigue ahí pero cuya función real cambió, o que no siguen el estándar (RFC, documentación oficial, etc.)
      Más que una crítica, creo que una gran parte de la culpa también está en las prácticas de refactorización de los mantenedores y en los problemas de legibilidad del código
      Preveo que la legibilidad del código y las pruebas seguirán siendo puntos clave para que colaboradores libres puedan contribuir de forma eficiente

  • Parece que en el proyecto elkjs usan deepwiki, pero sinceramente no me gusta https://deepwiki.com/kieler/elkjs/5-usage-guide
    Me costó encontrar la información que quería
    Por ejemplo, en deepwiki no pude encontrar la estructura del objeto json principal de configuración
    Al final solo pude encontrarla en la página de documentación oficial original del proyecto Elk, “no creada por IA”: https://eclipse.dev/elk/documentation/tooldevelopers/graphdatastructure/jsonformat.html
    Claro, esto es solo un ejemplo

    • Decir que “lo usan” me parece un poco exagerado
      En ninguna parte del repositorio oficial https://github.com/kieler/elkjs hay un enlace relacionado con deepwiki
      Cualquiera puede simplemente solicitarle a deepwiki que genere un repositorio de GitHub por su cuenta
      El solo hecho de que exista deepwiki no significa que ese proyecto lo haya autorizado o revisado
      Simplemente se mete por su cuenta y existe ahí; se siente como una especie de spam SEO
  • Revisé en deepwiki algunos repositorios open source que conozco bastante bien
    El único que tiene wiki es LLVM(https://deepwiki.com/llvm/llvm-project)
    En la primera pantalla aparecen listados de forma rara solo algunos directorios superiores, y el diagrama del pipeline de compilación está mal
    Por ejemplo, Clang-AST debería estar incluido en el frontend de clang, pero no lo está, y en el pipeline de optimización el flujo de vectorización y selección de instrucciones está enredado de forma extraña
    Faltan por completo partes importantes como GlobalISel, y también es rara la selección de backend destacada
    Omite por completo partes realmente importantes de LLVM, como sus principales passes de simplificación (InstCombine)
    Incluso entrando a páginas más detalladas, no hay mención de LLVM IR, del pass manager ni de la estrategia de canonicalización de los passes
    Tampoco trata en absoluto el papel de TableGen, cuando en realidad entender TableGen y sus mensajes de error es de lo más difícil del desarrollo de backends en LLVM
    deepwiki parece obsesionarse con archivos enormes, como páginas de más de 30 mil líneas, mientras que núcleos importantes como clang codegen o InstCombine, que están repartidos en múltiples archivos de decenas de miles de líneas, son ignorados por completo

    • A mí también me pasó algo parecido
      La calidad de los diagramas en proyectos que conozco bien estaba muy por debajo del nivel de ingeniería esperado

    • Es una observación interesante
      (Aunque no conozco el funcionamiento interno de deepwiki) me pregunto si el resultado cambiaría mucho si se eliminaran metadatos numéricos como tamaño de archivo, cantidad de commits, etc., o si se juntaran todos los archivos en uno solo marcando ruta+nombre de archivo

  • deepwiki antes me ayudó mucho al refactorizar un codebase grande en playwright usando automatización de navegador basada únicamente en CDP
    Aplausos al equipo que hizo la herramienta
    Los resúmenes y diagramas autogenerados son excelentes, pero la verdadera fortaleza está en la función de preguntas adicionales de “deep research” al final
    Me parece mucho mejor que OpenAI o perplexity para hacer deep research sobre codebases complejos (puppeteer, playwright, chromium, etc.)

  • Personalmente generé documentación para mi repositorio con deepwiki y sentí que fue bastante útil
    Aunque tendía a profundizar demasiado en algunas partes simples y a pasar por encima de las partes importantes
    En general sí daba un resumen bastante detallado de qué hace el paquete y por qué

  • Siento que este texto originalmente debería haber sido un breve blog técnico; me pregunto por qué se siente como texto de ventas, como si fuera copy comercial
    Desde la frase “Estamos creando más código que nunca. Claude, el LLM, ya escribe la mayor parte del código de Anthropic. Ahora el desafío ya no es producir código, sino entenderlo.” algo se siente como si lo hubiera escrito una IA
    Todo el texto está demasiado lleno de ese estilo tan típico de IA, y me costó concentrarme al leerlo
    Quizá sea el resultado de que el autor siente que la IA escribe mejor que él, pero de verdad quisiera recomendarle que escriba directamente con su propia voz
    Últimamente, mientras pienso qué partes le habrán pedido a la IA que redacte, termino ignorando a propósito textos generados por IA como “también ofrece un grafo de dependencias para el dockerfile, el README y los scripts, así que puedes ponerte a trabajar de inmediato”

    • Estoy de acuerdo en parte, pero creo que las dos primeras frases que citaste más bien tienen tantos errores gramaticales en inglés que cuesta pensar que las haya escrito una IA
  • Me parece una reseña muy buena (¡deepwiki de verdad sorprende!)
    Habría sido mejor si el código fuera open source
    Hace poco encontré algunos intentos open source

  • ¿Y si no me siento cómodo confiándole mi código a un tercero como deepwiki? ¿Hay alguna alternativa open source o que pueda ejecutar yo mismo en local?

    • Mi forma de hacerlo es esta:
      1. Archivo todo el repositorio en un solo archivo de texto con Repopack https://github.com/yamadashy/repomix
      2. Comprimir el archivo con LLMLingua-2 para reducir la cantidad de tokens https://github.com/microsoft/LLMLingua
        (mientras menos tokens haya, más contexto se le puede dar al LLM, así que entiende mejor el repositorio)
      3. Copiar y pegar todo el contenido del archivo de texto comprimido en ChatGPT o en la entrada de un LLM local
      4. Pedirle al LLM que genere la documentación
        Por ejemplo: “Este código es todo el código fuente del repositorio. Con base en el contexto actual, crea por favor un índice general”
        Si el índice queda bien, le pido que genere el primer capítulo, y así repito hasta completar toda la documentación
      5. Si es un codebase en Typescript/Javascript, usar un bundler como esbuild en el paso 2 también ayuda a ahorrar tokens
      6. Si te interesa LLMLingua-2, también puedes revisar mi port en Typescript, que se puede usar directamente sin instalar nada: https://atjsh.github.io/llmlingua-2-js/