5 puntos por GN⁺ 2025-11-12 | 4 comentarios | Compartir por WhatsApp
  • En el trabajo diario es frecuente que colegas envíen texto como captura de pantalla, y esa es una forma ineficiente de compartir información que vuelve extremadamente difícil buscar código y entender el contexto
  • El código recibido en captura no permite saber nada del contexto, como la definición de variables, la ubicación de módulos o el manejo de excepciones, así que hay que teclearlo manualmente en el buscador o recurrir a un agente de programación
  • Si envían los logs de errores de compilación en captura, es imposible saber qué se intentó compilar, en qué línea falló o cuál es el mensaje exacto del error, por lo que resolver el problema se vuelve imposible
  • Si se usa copiar y pegar o se comparte el archivo o un enlace de GitHub, se puede aprovechar la búsqueda del IDE y revisar todo el contexto
  • Salvo que se trate de un problema relacionado con la visualización en pantalla, el texto debe compartirse en un formato que se pueda copiar, no como captura, para mantener la eficiencia en la colaboración

Caso 1 del problema de las capturas: código

  • Al hablar de un problema relacionado con código, un colega envía una captura del código
    • Es imposible entender el contexto clave, como dónde se define la variable slug, cómo se genera baseUrl, por qué el dominio está hardcodeado, cómo se manejan las excepciones o dónde está ese módulo
    • Hay que teclear manualmente en el buscador el código que aparece en la captura o usar un agente de programación para encontrar los módulos relacionados
  • Si se usa copiar y pegar, incluso la misma línea permite ver mucho más contexto, y además se puede pegar directamente en la búsqueda del IDE
  • Compartir el archivo o un enlace de GitHub es mucho más eficiente

Caso 2 del problema de las capturas: logs de errores de compilación

  • Llega una captura del log de error junto con una solicitud como: "La compilación falló, ¿puedes revisarlo?"
    • No se sabe en absoluto qué se compiló, en qué línea falló ni cuál es exactamente el mensaje de error
    • A veces, al hacer una recompilación completa en la propia estación de trabajo, todo termina compilando bien
  • Es un problema que se resolvería fácilmente si se copiara el log completo o se enviara el log volcado a un archivo

Cómo compartir texto correctamente

  • No envíes texto como captura; compártelo en un formato que se pueda copiar
  • Usa capturas solo para mostrar problemas visuales de la pantalla o cuando haya información relacionada que se perdería en texto plano
  • Compartir archivos o enlaces de GitHub es la mejor forma de entender el contexto y buscar código

4 comentarios

 
tested 2025-11-12

No me gustan las capturas de pantalla de texto

A veces subo el código como captura porque, al capturarlo, se aprovechan la legibilidad que muestra el editor y la comodidad de los atajos de captura que el OS trae por defecto.

Si existiera un programa que, con un solo atajo, tomara el código de la imagen capturada, lo convirtiera en un enlace como los de Text fragments para poder compartirlo externamente y lo pegara de inmediato, creo que usaría eso.

Que al subirlo a Slack se vea en la vista previa y que, al entrar al enlace, se pueda copiar el código

 
kunggom 2025-11-12

Odio las capturas de pantalla de texto

Para generar algo de polémica, les comparto un sitio que convierte código en capturas bonitas para verlo. jajaja

https://ray.so/

Yo también, cuando envío algo por mensajería o correo, trato de usar texto siempre que puedo, pero la verdad es que, según el caso, usar solo texto puede terminar siendo incluso más incómodo.
En cambio, hacer una captura de pantalla se resuelve desde la GUI con solo apretar un atajo, seleccionar la parte de la pantalla y pegarla, así que para quien la envía probablemente se siente más cómodo.
Pero, como también se señala en el texto, para quien la recibe muchas veces una captura por sí sola no transmite todo el contexto, y además buscar o copiar y pegar también resulta incómodo, así que entiendo que de ahí venga la molestia. Y eso sin contar el overhead mucho mayor de lo necesario que genera para la transferencia y el almacenamiento de datos.
Bueno, si me pongo a hilar fino con estas cosas, personalmente también me molesta desde antes que dentro de la empresa la documentación interna se haga en archivos de Word en vez de usar una wiki, o cosas por el estilo…

 
GN⁺ 2025-11-12
Opiniones en Hacker News
  • Como ya se mencionó en otros comentarios, el OCR automático en las plataformas de Apple es realmente revolucionario
    Creo que una función así debería venir por defecto en los visores de documentos de todas las plataformas
    Otra cosa que me gustaría es que las capturas de pantalla incluyeran metadatos. Por ejemplo, si capturas una foto de Instagram, que incluya esa URL; en el navegador, la URL actual y la ruta del DOM; en una app de mapas, las coordenadas; y en un visor de PDF, el hash SHA1 del documento y el desplazamiento
    Claro, habría problemas de privacidad, pero siento que esta idea ya debe haberse tratado en la academia
    Hoy en día el concepto de archivo está abstraído, así que las capturas de pantalla se sienten como el lenguaje común de la era de la computación móvil
    También quiero mencionar sí o sí Screenshot Conf

    • Estoy totalmente de acuerdo con la función de OCR, pero incrustar metadatos podría ser una verdadera pesadilla de privacidad
      Las capturas de pantalla se manejan a nivel del sistema operativo, y es peligroso que una app pueda saber que fue capturada o conocer información de ubicación
      Empresas como Evernote o CloudApp lo intentaron, pero al final fracasaron. Las capturas de pantalla son útiles porque son simples
    • Yo soy el autor del texto, y debería haber mencionado el problema de que a las capturas de páginas web les falta la URL
      El sistema que construyo pone mucha información de contexto en la URL, pero la captura no la incluye
      Por eso siempre tengo que pedir la URL por texto aparte
    • Hoy en día Google y Apple también reconocen esta tendencia
      Después de una captura, meten en la UI funciones como insights de IA, búsqueda de productos, conversaciones con Gemini/LLM
      Eso es porque todo el mundo usa capturas para guardar o buscar información
    • La idea de incluir la URL de una foto de Instagram en una captura es una pesadilla de privacidad total
    • Dato curioso: en las primeras versiones de desarrollo de MacPaint había una función simple para copiar OCR
      Pero la quitaron de la versión final porque temían que la gente lo usara como procesador de textos
  • Yo uso capturas de pantalla con frecuencia
    La razón es que mantienen el ancho de 80 caracteres para una mejor legibilidad, y además preservan la fuente monoespaciada y el resaltado de sintaxis tal cual
    Si quiero asegurarme de que el código o la salida de terminal no se rompan en email o chats móviles, la captura es lo más confiable
    Claro, si se necesita el archivo completo, lo adjunto, pero también envío una captura de la parte relevante

    • En el chat, la posibilidad de copiar y buscar es más importante
      Las capturas hay que ampliarlas, y además perjudican la accesibilidad
      Si lo mandas como texto, es fácil de buscar y copiar
    • Lo del “ancho de 80 caracteres” es cuestión de preferencia personal
      La mayoría de los sistemas ya soportan fuentes monoespaciadas, y el problema son más bien factores del entorno como el renderizado de Gmail
      GMail no tiene límite de ancho y además el tamaño de fuente varía mucho, así que es difícil de leer
    • Esta preferencia de formato es personal, así que no debería imponerse con capturas
      En URLs largas o pantallas anchas, la legibilidad incluso empeora bastante
    • Yo también prefiero las capturas
      Porque muestran intactos los colores, el formato y el contexto
      Cuando explicas un problema, aquello de que “una imagen vale más que mil palabras” sí aplica
    • Yo creo que es mucho mejor que el código llegue como texto
      Así puedo verlo en mi editor con la fuente, ancho y colores que prefiera, y además puedo buscarlo y editarlo
      Las capturas al final les complican la vida a los demás
  • La función de reconocimiento y copia de texto en Mac e iOS es realmente revolucionaria
    Puedes copiar de inmediato el texto de una captura o una foto y pegarlo en una nota

    • La Snipping Tool de Windows también tiene extracción de texto
    • Alguien me mandó por iMessage una foto con un número de teléfono, y solo tuve que tocarlo para que se abriera de inmediato la ventana para llamar
      En ese momento de verdad sentí que estaba viviendo en el futuro
    • La integración de copiar y pegar entre MacBook y iPhone cambia por completo el flujo de trabajo
    • Esta función es buena porque está integrada de forma consistente en todo el sistema
      En Safari incluso puedes traducir el texto dentro de imágenes, y eso es especialmente útil para traducir páginas web en japonés
    • Yo uso Shottr y apenas tomo una captura presiono “O” para ejecutar OCR al instante
      Se procesa de inmediato, sin guardar el archivo, y eso resulta muy cómodo
  • Antes se pegaban capturas en documentos de Word para enviarlas
    Pero ahora proponer volver a extraer el texto con LLM es demasiado derrochador
    Lo que de verdad hace falta es una innovación de UI que permita compartir texto con la misma facilidad que una captura

    • Hay casos peores. Algunas personas directamente le toman una foto a la pantalla y la envían
      Cuando veo que aspirantes a programadores hacen eso, me desespera
    • En cierta empresa usaban documentos de Word como si fueran carpetas
      Metían otros archivos de Word dentro del documento como objetos reales
    • También hay una historieta de XKCD relacionada → xkcd 2116
  • La séptima regla de mi texto “Cómo pedir ayuda en Slack” es: “no subas capturas de texto”
    Aunque el OCR de Apple sea bueno, el problema de que no se puede buscar sigue existiendo
    Enlace al original

    • Pero Spotlight y Photos sí permiten buscar texto dentro de capturas
  • Prefiero enviar el documento completo o el enlace al código junto con una captura de la parte relevante
    Como queda el contexto visual, cuando lo vuelvo a ver después lo recuerdo mejor

  • Los desarrolladores junior suelen compartir muchas capturas de texto durante sus primeras semanas
    Pero en móvil son incómodas de leer, y Slack comprime las imágenes, así que ni siquiera se pueden ampliar bien
    Al final, la mayoría termina aprendiendo a compartirlo como texto

  • En MS Teams el soporte para bloques de código es tan malo que muchas veces se usan capturas

    • Yo les estoy enseñando a mis compañeros cómo hacer bloques de código Markdown en Teams
      La función existe, pero no está nada visible
    • Cuando ves una captura en Teams, la mayoría de las veces es una captura de parte de una conversación en otro chat
  • Las capturas de pantalla son una forma rápida y consistente
    Funcionan igual en webapps, apps nativas, sitios y en cualquier lado
    Puede ser incómodo para quien las recibe, pero desde el punto de vista de quien las envía son eficientes

  • En Linux tengo conectada la acción personalizada de xfce4-screenshooter a un script de OCR con tesseract
    Cuando capturo una región seleccionada, el texto se copia automáticamente al portapapeles
    Cuando el reconocimiento es difícil, uso Gemma3-4B + llama.cpp

 
ndrgrd 2025-11-12

Hoy en día, la mayoría de los navegadores tienen una función llamada Text Fragment, y la uso mucho porque es útil.

Prueben si funciona con el enlace resaltado de este artículo.