5 puntos por kirinonakar 2026-04-12 | Aún no hay comentarios. | Compartir por WhatsApp

Es un traductor OCR para Windows hecho con rust/slint.
Basado en VLM, soporta gemini y modelos locales. (LM Studio, API compatible con OpenAI, etc.)
Ofrece varias funciones como atajos de teclado, overlay, cuadro de texto, retraducción automática, portapapeles, cambio de prompt y estilos.
En el modo de cuadro de texto, también se puede hacer clic dentro de la pantalla que se está traduciendo.
Es ideal para traducir juegos.

Entre los modelos locales, gemma-4-31b-it tiene la mejor calidad y gemma-4-26b-a4b ofrece el mejor equilibrio entre velocidad y calidad.
qwen3.5 9 es rápido, pero se siente un poco por debajo.

También hay pequeñas diferencias según el system prompt.
Se puede indicar el estilo de traducción, y si escribes directamente cosas como nombres propios en el system prompt, lo maneja bien.
Si cambias el system prompt, no solo sirve para traducir, también puede hacer otras cosas.
(markdown, crear json, resumir, convertir un cómic en novela, mostrar la posición del texto, describir imágenes, generar prompts, evaluar el diseño de páginas web, etc.)
Las formas de aprovecharlo son prácticamente infinitas.

Para instrucciones de uso más detalladas, consulta GitHub.
https://github.com/kirinonakar/ocr_trans

Aún no hay comentarios.

Aún no hay comentarios.