3 puntos por hcmhcs0 2026-03-16 | 2 comentarios | Compartir por WhatsApp

¡Hola! Soy un estudiante desarrollador.

Últimamente me interesé en el tema de los agentes de IA, así que estuve estudiando revisando a fondo las instrucciones del sistema publicadas en OpenClaw. Tenía curiosidad por saber por qué los agentes logran resultados mucho mejores que el simple razonamiento de un LLM, y con qué tipo de instrucciones y estructura de sistema están construidos. (Quería crear un agente de IA adaptado a mi situación para mejorar mi productividad jaja). Pero como en vscode las instrucciones del sistema dentro del código estaban todas en inglés, y la documentación relacionada también estaba toda en inglés, leerlas yendo y viniendo con una pestaña de traductor abierta, copiando y pegando, me rompía totalmente el contexto y no podía concentrarme. Cuando además no se podía copiar el texto, como en imágenes o PDFs, era todavía más frustrante.

Entonces, viendo ScreenHint, una app que uso mucho para fijar capturas en la pantalla, pensé: “con esta UX, estaría buenísimo traducir directamente el área capturada”. Como soy estudiante, también me pesaba tener que gastar dinero cada vez en una API de traducción, así que lo planteé desde el principio para que funcionara on-device. Justo gracias a Claude Code pude implementar esta idea rápidamente, y así nació mi primer proyecto de código abierto.

ScreenTranslate — es una app para macOS que, al capturar la pantalla, hace OCR → traducción inmediatamente. Se queda residente en la barra de menú y se puede usar al instante con atajos de teclado.

Tiene dos funciones principales:

  1. Traducción de capturas de pantalla — atajo de teclado → arrastrar el área → reconocimiento con OCR → popup de traducción
  2. Traducción de texto — seleccionar texto → atajo de teclado → traducción inmediata (sin OCR)

Es gratis y de código abierto (GPL v3). Funciona on-device, así que ningún dato de traducción se envía al servidor.

Características:

  • Basado en Apple Vision OCR + Apple Translation, funciona sin internet
  • La velocidad percibida es mucho más rápida que la app oficial de DeepL. Desde la captura hasta el popup de traducción tarda alrededor de 1 segundo
  • Si se necesita un motor en la nube, se pueden usar DeepL, Google Cloud y Azure con BYOK (ingresando tu propia API key)
  • Guardado del historial de traducciones, copia automática al portapapeles
  • Soporta 20 idiomas

Stack técnico:

  • macOS 15+ / Swift 6 / SwiftUI / SwiftData
  • Flujo interno: Vision(VNRecognizeTextRequest) → preprocesamiento de saltos de línea → Translation o API → popup
  • Sin dependencias externas. Solo usa frameworks nativos de Apple (requisito: macos 15+ o superior; compatible tanto con Apple Silicon como con Intel)

GitHub: https://github.com/hcmhcs/screenTranslate
Video demo: https://www.youtube.com/watch?v=ItYNAyue7eo
Descarga: puedes bajar el DMG desde GitHub Releases o compilarlo tú mismo (consulta el archivo README.md)

Al principio lo hice rápido para usarlo yo solo, así que me da un poco de vergüenza, pero creo que al final quedó bastante bien. Incluso lo lancé por primera vez en Product Hunt, y ahora estoy recibiendo usuarios reales, juntando feedback y actualizando el proyecto en ese proceso.
Como es mi primer proyecto open source en solitario, seguro todavía le faltan cosas, así que agradecería mucho cualquier feedback o PR :)

2 comentarios

 
guarder 2026-03-24

¡Lo estoy usando increíblemente bien!

 
hcmhcs0 2026-03-24

¡Muchas gracias por tu cálido comentario! Justo ahora he estado puliendo varias cosas para mejorar la facilidad de uso, así que saber que lo estás usando bien de verdad me motiva muchísimo, jaja. Si en algún momento te surge algo incómodo al usarlo, no dudes en decírmelo con toda confianza :)