- En el trabajo diario es frecuente que colegas envíen texto como captura de pantalla, y esa es una forma ineficiente de compartir información que vuelve extremadamente difícil buscar código y entender el contexto
- El código recibido en captura no permite saber nada del contexto, como la definición de variables, la ubicación de módulos o el manejo de excepciones, así que hay que teclearlo manualmente en el buscador o recurrir a un agente de programación
- Si envían los logs de errores de compilación en captura, es imposible saber qué se intentó compilar, en qué línea falló o cuál es el mensaje exacto del error, por lo que resolver el problema se vuelve imposible
- Si se usa copiar y pegar o se comparte el archivo o un enlace de GitHub, se puede aprovechar la búsqueda del IDE y revisar todo el contexto
- Salvo que se trate de un problema relacionado con la visualización en pantalla, el texto debe compartirse en un formato que se pueda copiar, no como captura, para mantener la eficiencia en la colaboración
Caso 1 del problema de las capturas: código
- Al hablar de un problema relacionado con código, un colega envía una captura del código
- Es imposible entender el contexto clave, como dónde se define la variable
slug, cómo se genera baseUrl, por qué el dominio está hardcodeado, cómo se manejan las excepciones o dónde está ese módulo
- Hay que teclear manualmente en el buscador el código que aparece en la captura o usar un agente de programación para encontrar los módulos relacionados
- Si se usa copiar y pegar, incluso la misma línea permite ver mucho más contexto, y además se puede pegar directamente en la búsqueda del IDE
- Compartir el archivo o un enlace de GitHub es mucho más eficiente
Caso 2 del problema de las capturas: logs de errores de compilación
- Llega una captura del log de error junto con una solicitud como: "La compilación falló, ¿puedes revisarlo?"
- No se sabe en absoluto qué se compiló, en qué línea falló ni cuál es exactamente el mensaje de error
- A veces, al hacer una recompilación completa en la propia estación de trabajo, todo termina compilando bien
- Es un problema que se resolvería fácilmente si se copiara el log completo o se enviara el log volcado a un archivo
Cómo compartir texto correctamente
- No envíes texto como captura; compártelo en un formato que se pueda copiar
- Usa capturas solo para mostrar problemas visuales de la pantalla o cuando haya información relacionada que se perdería en texto plano
- Compartir archivos o enlaces de GitHub es la mejor forma de entender el contexto y buscar código
4 comentarios
No me gustan las capturas de pantalla de texto
A veces subo el código como captura porque, al capturarlo, se aprovechan la legibilidad que muestra el editor y la comodidad de los atajos de captura que el OS trae por defecto.
Si existiera un programa que, con un solo atajo, tomara el código de la imagen capturada, lo convirtiera en un enlace como los de Text fragments para poder compartirlo externamente y lo pegara de inmediato, creo que usaría eso.
Que al subirlo a Slack se vea en la vista previa y que, al entrar al enlace, se pueda copiar el código
Odio las capturas de pantalla de texto
Para generar algo de polémica, les comparto un sitio que convierte código en capturas bonitas para verlo. jajaja
https://ray.so/
Yo también, cuando envío algo por mensajería o correo, trato de usar texto siempre que puedo, pero la verdad es que, según el caso, usar solo texto puede terminar siendo incluso más incómodo.
En cambio, hacer una captura de pantalla se resuelve desde la GUI con solo apretar un atajo, seleccionar la parte de la pantalla y pegarla, así que para quien la envía probablemente se siente más cómodo.
Pero, como también se señala en el texto, para quien la recibe muchas veces una captura por sí sola no transmite todo el contexto, y además buscar o copiar y pegar también resulta incómodo, así que entiendo que de ahí venga la molestia. Y eso sin contar el overhead mucho mayor de lo necesario que genera para la transferencia y el almacenamiento de datos.
Bueno, si me pongo a hilar fino con estas cosas, personalmente también me molesta desde antes que dentro de la empresa la documentación interna se haga en archivos de Word en vez de usar una wiki, o cosas por el estilo…
Opiniones en Hacker News
Como ya se mencionó en otros comentarios, el OCR automático en las plataformas de Apple es realmente revolucionario
Creo que una función así debería venir por defecto en los visores de documentos de todas las plataformas
Otra cosa que me gustaría es que las capturas de pantalla incluyeran metadatos. Por ejemplo, si capturas una foto de Instagram, que incluya esa URL; en el navegador, la URL actual y la ruta del DOM; en una app de mapas, las coordenadas; y en un visor de PDF, el hash SHA1 del documento y el desplazamiento
Claro, habría problemas de privacidad, pero siento que esta idea ya debe haberse tratado en la academia
Hoy en día el concepto de archivo está abstraído, así que las capturas de pantalla se sienten como el lenguaje común de la era de la computación móvil
También quiero mencionar sí o sí Screenshot Conf
Las capturas de pantalla se manejan a nivel del sistema operativo, y es peligroso que una app pueda saber que fue capturada o conocer información de ubicación
Empresas como Evernote o CloudApp lo intentaron, pero al final fracasaron. Las capturas de pantalla son útiles porque son simples
El sistema que construyo pone mucha información de contexto en la URL, pero la captura no la incluye
Por eso siempre tengo que pedir la URL por texto aparte
Después de una captura, meten en la UI funciones como insights de IA, búsqueda de productos, conversaciones con Gemini/LLM
Eso es porque todo el mundo usa capturas para guardar o buscar información
Pero la quitaron de la versión final porque temían que la gente lo usara como procesador de textos
Yo uso capturas de pantalla con frecuencia
La razón es que mantienen el ancho de 80 caracteres para una mejor legibilidad, y además preservan la fuente monoespaciada y el resaltado de sintaxis tal cual
Si quiero asegurarme de que el código o la salida de terminal no se rompan en email o chats móviles, la captura es lo más confiable
Claro, si se necesita el archivo completo, lo adjunto, pero también envío una captura de la parte relevante
Las capturas hay que ampliarlas, y además perjudican la accesibilidad
Si lo mandas como texto, es fácil de buscar y copiar
La mayoría de los sistemas ya soportan fuentes monoespaciadas, y el problema son más bien factores del entorno como el renderizado de Gmail
GMail no tiene límite de ancho y además el tamaño de fuente varía mucho, así que es difícil de leer
En URLs largas o pantallas anchas, la legibilidad incluso empeora bastante
Porque muestran intactos los colores, el formato y el contexto
Cuando explicas un problema, aquello de que “una imagen vale más que mil palabras” sí aplica
Así puedo verlo en mi editor con la fuente, ancho y colores que prefiera, y además puedo buscarlo y editarlo
Las capturas al final les complican la vida a los demás
La función de reconocimiento y copia de texto en Mac e iOS es realmente revolucionaria
Puedes copiar de inmediato el texto de una captura o una foto y pegarlo en una nota
En ese momento de verdad sentí que estaba viviendo en el futuro
En Safari incluso puedes traducir el texto dentro de imágenes, y eso es especialmente útil para traducir páginas web en japonés
Se procesa de inmediato, sin guardar el archivo, y eso resulta muy cómodo
Antes se pegaban capturas en documentos de Word para enviarlas
Pero ahora proponer volver a extraer el texto con LLM es demasiado derrochador
Lo que de verdad hace falta es una innovación de UI que permita compartir texto con la misma facilidad que una captura
Cuando veo que aspirantes a programadores hacen eso, me desespera
Metían otros archivos de Word dentro del documento como objetos reales
La séptima regla de mi texto “Cómo pedir ayuda en Slack” es: “no subas capturas de texto”
Aunque el OCR de Apple sea bueno, el problema de que no se puede buscar sigue existiendo
Enlace al original
Prefiero enviar el documento completo o el enlace al código junto con una captura de la parte relevante
Como queda el contexto visual, cuando lo vuelvo a ver después lo recuerdo mejor
Los desarrolladores junior suelen compartir muchas capturas de texto durante sus primeras semanas
Pero en móvil son incómodas de leer, y Slack comprime las imágenes, así que ni siquiera se pueden ampliar bien
Al final, la mayoría termina aprendiendo a compartirlo como texto
En MS Teams el soporte para bloques de código es tan malo que muchas veces se usan capturas
La función existe, pero no está nada visible
Las capturas de pantalla son una forma rápida y consistente
Funcionan igual en webapps, apps nativas, sitios y en cualquier lado
Puede ser incómodo para quien las recibe, pero desde el punto de vista de quien las envía son eficientes
En Linux tengo conectada la acción personalizada de xfce4-screenshooter a un script de OCR con tesseract
Cuando capturo una región seleccionada, el texto se copia automáticamente al portapapeles
Cuando el reconocimiento es difícil, uso Gemma3-4B + llama.cpp
Hoy en día, la mayoría de los navegadores tienen una función llamada Text Fragment, y la uso mucho porque es útil.
Prueben si funciona con el enlace resaltado de este artículo.