Desarrollo de un flujo de trabajo para traducir documentación oficial – traducción y búsqueda de la documentación oficial de Spring y MySQL
(devrunner.dev)Introducción
Hola.
Esta vez creé un flujo de trabajo para traducir una serie de documentación oficial, y publiqué los resultados de traducción de MySQL y Spring Boot en un formato que permite hacer búsquedas.
Yo suelo revisar la documentación oficial antes y después de las entrevistas, y espero que también les sirva a quienes quieran usarlo con un propósito similar.
Los prompts reales, los enlaces del servicio y la entrada del blog de OpenAI que tomé como referencia al usar 5.1 esta vez están reunidos en la colección de enlaces de abajo.
Después de GPT-5.1: percepción sobre el rendimiento de razonamiento de los LLM
Quiero dejar registrado cómo sentí la diferencia de rendimiento mientras intentaba automatizar traducciones desde la época de GPT-3.5.
Con GPT-3.5, incluso en textos relativamente cortos de unas 5,000 a 10,000 letras, muchas veces no se lograba realizar con buena calidad ni tareas pequeñas como corregir el formato Markdown.
En cambio, con GPT-5.1 fue posible realizar con bastante estabilidad tareas como las siguientes.
- Extraer de forma estable más de 1,000 datos de TOC (6 columnas), manteniendo el orden, desde HTML de más de 100,000 caracteres
- Aunque se deje al LLM decidir qué términos conservar en inglés y cuáles traducir, devuelve documentación con buena legibilidad (ej.: en la documentación de Spring, bean se mantiene en inglés y factory se traduce)
Cuando algo se rompía durante el trabajo o necesitaba ajustes, respondía agregando reglas al system prompt, y el hecho de que la calidad del resultado no se viera muy afectada aunque el system prompt se hiciera largo era algo difícil de esperar en modelos del pasado.
Colección de enlaces
Abajo dejé organizados los materiales de referencia relacionados con este trabajo.
Lo comparto porque creo que puede servir como referencia para mostrar que incluso con solicitudes de prompts así de pesadas se pueden obtener resultados a nivel de servicio actual.
(No creo que el prompt en sí esté especialmente bien escrito jaja; en los blogs de Anthropic y OpenAI hay muchos consejos sobre prompts, así que adjunto uno representativo).
2 comentarios
Parece que la cantidad de documentos en los resultados de búsqueda siempre es 0.
¡Uy! Gracias por avisar.
A mí ahora me está saliendo bien. De todos modos, por si acaso, revisé el despliegue una vez más.
Pero para poder verificarlo, te agradecería si me dices qué término de búsqueda usaste.
Ahora mismo esto no tiene un diccionario de sinónimos entre coreano <-> inglés, así que puede que no haya salido simplemente porque no coincidió de verdad.