Odio las capturas de pantalla de texto

(parkscomputing.com)

5 puntos por GN⁺ 2025-11-12 | 4 comentarios | Compartir por WhatsApp

En el trabajo diario es frecuente que colegas envíen texto como captura de pantalla, y esa es una forma ineficiente de compartir información que vuelve extremadamente difícil buscar código y entender el contexto
El código recibido en captura no permite saber nada del contexto, como la definición de variables, la ubicación de módulos o el manejo de excepciones, así que hay que teclearlo manualmente en el buscador o recurrir a un agente de programación
Si envían los logs de errores de compilación en captura, es imposible saber qué se intentó compilar, en qué línea falló o cuál es el mensaje exacto del error, por lo que resolver el problema se vuelve imposible
Si se usa copiar y pegar o se comparte el archivo o un enlace de GitHub, se puede aprovechar la búsqueda del IDE y revisar todo el contexto
Salvo que se trate de un problema relacionado con la visualización en pantalla, el texto debe compartirse en un formato que se pueda copiar, no como captura, para mantener la eficiencia en la colaboración

Caso 1 del problema de las capturas: código

Al hablar de un problema relacionado con código, un colega envía una captura del código
- Es imposible entender el contexto clave, como dónde se define la variable slug, cómo se genera baseUrl, por qué el dominio está hardcodeado, cómo se manejan las excepciones o dónde está ese módulo
- Hay que teclear manualmente en el buscador el código que aparece en la captura o usar un agente de programación para encontrar los módulos relacionados
Si se usa copiar y pegar, incluso la misma línea permite ver mucho más contexto, y además se puede pegar directamente en la búsqueda del IDE
Compartir el archivo o un enlace de GitHub es mucho más eficiente

Caso 2 del problema de las capturas: logs de errores de compilación

Llega una captura del log de error junto con una solicitud como: "La compilación falló, ¿puedes revisarlo?"
- No se sabe en absoluto qué se compiló, en qué línea falló ni cuál es exactamente el mensaje de error
- A veces, al hacer una recompilación completa en la propia estación de trabajo, todo termina compilando bien
Es un problema que se resolvería fácilmente si se copiara el log completo o se enviara el log volcado a un archivo

Cómo compartir texto correctamente

No envíes texto como captura; compártelo en un formato que se pueda copiar
Usa capturas solo para mostrar problemas visuales de la pantalla o cuando haya información relacionada que se perdería en texto plano
Compartir archivos o enlaces de GitHub es la mejor forma de entender el contexto y buscar código

4 comentarios

tested 2025-11-12

No me gustan las capturas de pantalla de texto

A veces subo el código como captura porque, al capturarlo, se aprovechan la legibilidad que muestra el editor y la comodidad de los atajos de captura que el OS trae por defecto.

Si existiera un programa que, con un solo atajo, tomara el código de la imagen capturada, lo convirtiera en un enlace como los de Text fragments para poder compartirlo externamente y lo pegara de inmediato, creo que usaría eso.

Que al subirlo a Slack se vea en la vista previa y que, al entrar al enlace, se pueda copiar el código

kunggom 2025-11-12

Odio las capturas de pantalla de texto

Para generar algo de polémica, les comparto un sitio que convierte código en capturas bonitas para verlo. jajaja

https://ray.so/

Yo también, cuando envío algo por mensajería o correo, trato de usar texto siempre que puedo, pero la verdad es que, según el caso, usar solo texto puede terminar siendo incluso más incómodo.
En cambio, hacer una captura de pantalla se resuelve desde la GUI con solo apretar un atajo, seleccionar la parte de la pantalla y pegarla, así que para quien la envía probablemente se siente más cómodo.
Pero, como también se señala en el texto, para quien la recibe muchas veces una captura por sí sola no transmite todo el contexto, y además buscar o copiar y pegar también resulta incómodo, así que entiendo que de ahí venga la molestia. Y eso sin contar el overhead mucho mayor de lo necesario que genera para la transferencia y el almacenamiento de datos.
Bueno, si me pongo a hilar fino con estas cosas, personalmente también me molesta desde antes que dentro de la empresa la documentación interna se haga en archivos de Word en vez de usar una wiki, o cosas por el estilo…

GN⁺ 2025-11-12

Opiniones en Hacker News

Como ya se mencionó en otros comentarios, el OCR automático en las plataformas de Apple es realmente revolucionario
Creo que una función así debería venir por defecto en los visores de documentos de todas las plataformas
Otra cosa que me gustaría es que las capturas de pantalla incluyeran metadatos. Por ejemplo, si capturas una foto de Instagram, que incluya esa URL; en el navegador, la URL actual y la ruta del DOM; en una app de mapas, las coordenadas; y en un visor de PDF, el hash SHA1 del documento y el desplazamiento
Claro, habría problemas de privacidad, pero siento que esta idea ya debe haberse tratado en la academia
Hoy en día el concepto de archivo está abstraído, así que las capturas de pantalla se sienten como el lenguaje común de la era de la computación móvil
También quiero mencionar sí o sí Screenshot Conf
- Estoy totalmente de acuerdo con la función de OCR, pero incrustar metadatos podría ser una verdadera pesadilla de privacidad
  Las capturas de pantalla se manejan a nivel del sistema operativo, y es peligroso que una app pueda saber que fue capturada o conocer información de ubicación
  Empresas como Evernote o CloudApp lo intentaron, pero al final fracasaron. Las capturas de pantalla son útiles porque son simples
- Yo soy el autor del texto, y debería haber mencionado el problema de que a las capturas de páginas web les falta la URL
  El sistema que construyo pone mucha información de contexto en la URL, pero la captura no la incluye
  Por eso siempre tengo que pedir la URL por texto aparte
- Hoy en día Google y Apple también reconocen esta tendencia
  Después de una captura, meten en la UI funciones como insights de IA, búsqueda de productos, conversaciones con Gemini/LLM
  Eso es porque todo el mundo usa capturas para guardar o buscar información
- La idea de incluir la URL de una foto de Instagram en una captura es una pesadilla de privacidad total
- Dato curioso: en las primeras versiones de desarrollo de MacPaint había una función simple para copiar OCR
  Pero la quitaron de la versión final porque temían que la gente lo usara como procesador de textos
Yo uso capturas de pantalla con frecuencia
La razón es que mantienen el ancho de 80 caracteres para una mejor legibilidad, y además preservan la fuente monoespaciada y el resaltado de sintaxis tal cual
Si quiero asegurarme de que el código o la salida de terminal no se rompan en email o chats móviles, la captura es lo más confiable
Claro, si se necesita el archivo completo, lo adjunto, pero también envío una captura de la parte relevante
- En el chat, la posibilidad de copiar y buscar es más importante
  Las capturas hay que ampliarlas, y además perjudican la accesibilidad
  Si lo mandas como texto, es fácil de buscar y copiar
- Lo del “ancho de 80 caracteres” es cuestión de preferencia personal
  La mayoría de los sistemas ya soportan fuentes monoespaciadas, y el problema son más bien factores del entorno como el renderizado de Gmail
  GMail no tiene límite de ancho y además el tamaño de fuente varía mucho, así que es difícil de leer
- Esta preferencia de formato es personal, así que no debería imponerse con capturas
  En URLs largas o pantallas anchas, la legibilidad incluso empeora bastante
- Yo también prefiero las capturas
  Porque muestran intactos los colores, el formato y el contexto
  Cuando explicas un problema, aquello de que “una imagen vale más que mil palabras” sí aplica
- Yo creo que es mucho mejor que el código llegue como texto
  Así puedo verlo en mi editor con la fuente, ancho y colores que prefiera, y además puedo buscarlo y editarlo
  Las capturas al final les complican la vida a los demás
La función de reconocimiento y copia de texto en Mac e iOS es realmente revolucionaria
Puedes copiar de inmediato el texto de una captura o una foto y pegarlo en una nota
- La Snipping Tool de Windows también tiene extracción de texto
- Alguien me mandó por iMessage una foto con un número de teléfono, y solo tuve que tocarlo para que se abriera de inmediato la ventana para llamar
  En ese momento de verdad sentí que estaba viviendo en el futuro
- La integración de copiar y pegar entre MacBook y iPhone cambia por completo el flujo de trabajo
- Esta función es buena porque está integrada de forma consistente en todo el sistema
  En Safari incluso puedes traducir el texto dentro de imágenes, y eso es especialmente útil para traducir páginas web en japonés
- Yo uso Shottr y apenas tomo una captura presiono “O” para ejecutar OCR al instante
  Se procesa de inmediato, sin guardar el archivo, y eso resulta muy cómodo
Antes se pegaban capturas en documentos de Word para enviarlas
Pero ahora proponer volver a extraer el texto con LLM es demasiado derrochador
Lo que de verdad hace falta es una innovación de UI que permita compartir texto con la misma facilidad que una captura
- Hay casos peores. Algunas personas directamente le toman una foto a la pantalla y la envían
  Cuando veo que aspirantes a programadores hacen eso, me desespera
- En cierta empresa usaban documentos de Word como si fueran carpetas
  Metían otros archivos de Word dentro del documento como objetos reales
- También hay una historieta de XKCD relacionada → xkcd 2116
La séptima regla de mi texto “Cómo pedir ayuda en Slack” es: “no subas capturas de texto”
Aunque el OCR de Apple sea bueno, el problema de que no se puede buscar sigue existiendo
Enlace al original
- Pero Spotlight y Photos sí permiten buscar texto dentro de capturas
Prefiero enviar el documento completo o el enlace al código junto con una captura de la parte relevante
Como queda el contexto visual, cuando lo vuelvo a ver después lo recuerdo mejor
Los desarrolladores junior suelen compartir muchas capturas de texto durante sus primeras semanas
Pero en móvil son incómodas de leer, y Slack comprime las imágenes, así que ni siquiera se pueden ampliar bien
Al final, la mayoría termina aprendiendo a compartirlo como texto
En MS Teams el soporte para bloques de código es tan malo que muchas veces se usan capturas
- Yo les estoy enseñando a mis compañeros cómo hacer bloques de código Markdown en Teams
  La función existe, pero no está nada visible
- Cuando ves una captura en Teams, la mayoría de las veces es una captura de parte de una conversación en otro chat
Las capturas de pantalla son una forma rápida y consistente
Funcionan igual en webapps, apps nativas, sitios y en cualquier lado
Puede ser incómodo para quien las recibe, pero desde el punto de vista de quien las envía son eficientes
En Linux tengo conectada la acción personalizada de xfce4-screenshooter a un script de OCR con tesseract
Cuando capturo una región seleccionada, el texto se copia automáticamente al portapapeles
Cuando el reconocimiento es difícil, uso Gemma3-4B + llama.cpp
- Captura de referencia: https://0x0.st/K9hq.png

ndrgrd 2025-11-12

Hoy en día, la mayoría de los navegadores tienen una función llamada Text Fragment, y la uso mucho porque es útil.

Prueben si funciona con el enlace resaltado de este artículo.

Odio las capturas de pantalla de texto

Caso 1 del problema de las capturas: código

Caso 2 del problema de las capturas: logs de errores de compilación

Cómo compartir texto correctamente

Lecturas relacionadas

4 comentarios

Opiniones en Hacker News