- Corrector gramatical de código abierto. Un producto que puede usarse en lugar de Grammarly, el conocido servicio comercial
- Cualquiera puede usarlo gratis, y su código y algoritmos están publicados de forma transparente
- Ofrece funciones para detectar y corregir automáticamente problemas de gramática, estilo y ortografía en textos en inglés
- Es adecuado para distintos tipos de usuarios, como desarrolladores, escritores y estudiantes, y ofrece posibilidades de personalización libre
- Como permite autoalojar el servidor y ejecutarlo localmente, ofrece ventajas en privacidad y protección de datos
Introducción a Harper
- Harper es un corrector gramatical y de estilo de código abierto que ofrece funciones similares a Grammarly
- Se ofrece completamente gratis, y cualquiera puede revisar y aprovechar libremente el código fuente
- Implementa funciones de corrección de textos en inglés como revisión ortográfica, detección de errores gramaticales y recomendaciones de mejora de estilo
- Los usuarios pueden instalar Harper en un servidor local o en su propia infraestructura para reforzar la privacidad de los datos
- Tiene gran escalabilidad y capacidad de personalización, por lo que es fácil modificar algoritmos y agregar funciones según las necesidades de cada quien
Funciones principales y ventajas
- Al ser un proyecto de código abierto, permite gestionar y mejorar ideas internas sin depender del servicio
- Aunque está optimizado para inglés, también deja abierta la posibilidad de ampliar el soporte multilingüe en el futuro
- Cuenta con un fuerte apoyo de la comunidad, por lo que la retroalimentación y las mejoras de funciones avanzan activamente
- Ofrece gran flexibilidad mediante un enfoque basado en servidor o instalación directa
Público objetivo y ejemplos de uso
- Es ideal para usuarios interesados en mejorar la calidad de su escritura en inglés, como ingenieros de software, redactores de documentación técnica y estudiantes
- Resulta ventajoso para organizaciones que quieren establecer su propio proceso de corrección de documentos sin exponer información personal a servicios externos
- Es eficaz en entornos que requieren personalización avanzada, como reglas a medida e integración con flujos de trabajo
2 comentarios
Opiniones de Hacker News
En la mayoría de los documentos, Harper puede ofrecer sugerencias en menos de 10 ms; por eso me pregunto por qué 10 l o 10 kg se aceptan como unidades familiares, pero 10 ms genera rechazo
Me gusta mucho más que las reglas gramaticales estén codificadas directamente en un programa de código abierto y uno mismo pueda modificarlas, en lugar de depender de ajuste de prompts o de reglas implícitamente “hardcodeadas” en los datos de entrenamiento de un LLM La configuración de LSP para Neovim se ve bastante bien documentación de integración con Neovim Siento que este tipo de herramientas son el futuro Sugieren que Automattic debería destacar esto en su página principal
Personalmente, considero una gran ventaja que no use LLM Grammarly se ha vuelto cada vez más inestable desde que agregó funciones de IA; hace una hora te decía que quitaras una coma y luego te pedía volver a ponerla, mostrando una clara falta de consistencia
Los modelos generales basados en LLM en realidad suelen confundirse con la puntuación; lo he visto como una desventaja bastante marcada, y sorprende que servicios como Grammarly dejen pasar ese problema tal cual
En el último año, las predicciones de Grammarly y gboard se han vuelto muy malas
Me pregunto si existe alguna herramienta similar desarrollada con base en LLM Los LLM no siempre son mejores, pero me interesa comparar la diferencia entre ambos enfoques
Bromean con que esas recomendaciones cambiantes sobre puntuación se parecen a los profesores de inglés
LanguageTool (competidor de Grammarly) también es de código abierto y puede ejecutarse localmente GitHub, imagen de Docker Yo suelo ejecutar LanguageTool localmente en un contenedor de Docker No he usado Harper a fondo, pero conocía su existencia desde hace tiempo; da gusto que haya varias opciones También desearía que en el sitio web de Harper se explicara claramente que una de las herramientas competidoras también puede ejecutarse en local
En la frase “Me and Jennifer went to have seen the ducks cousin.” no se detecta ningún error Señalan que tendrían que ampliarse mucho más este tipo de reglas para acercarse al nivel de Grammarly
Al principio impresionaba, pero después de varias pruebas, la conclusión fue que el rendimiento es irregular y que ni siquiera detecta errores bastante básicos
De forma similar, “My name John. What your name? What day today?” tampoco se marca como error gramatical
Se preguntan qué se supone que demuestran estas frases de prueba
Opinan que sería realmente útil contar con un sitio web donde se pudiera hacer una demo o una prueba antes de descargarlo o instalar la extensión La extensión de Firefox enlaza a esta página, pero al pegar textos largos el resaltado no funciona correctamente
Se preguntan por qué no usar LLM en herramientas de aprendizaje de idiomas Piensan que los problemas de lenguaje podrían dejarse al 100% en manos de un LLM Preguntan si alguien ha visto alguna vez a ChatGPT cometer errores en inglés
Desde que Grammarly reforzó sus funciones de IA, ha llegado a sugerir cosas raras como separar “wasn't” y proponer “was trulyn't” imagen relacionada
Los errores de los LLM se ven con suficiente frecuencia, y a veces hacen sugerencias muy absurdas Claro, la mayor parte del tiempo funcionan muy bien, pero nunca llegan a ser realmente “confiables”, e incluso tienden a seguir los mismos errores del usuario
Señalan que este tipo de herramientas de aprendizaje de idiomas muchas veces se usan, en esencia, para evitar “aprender realmente” el idioma
Se preguntan cuál es el mercado objetivo de Grammarly Dudan si estará dirigido a profesionales que usan el inglés como segunda lengua
Presentan que ofrece un excelente servidor LSP que incluso puede encargarse de revisar la gramática de comentarios de código documentación de LSP
Como es un producto hecho por Automattic, hay quienes dudan en usarlo por temor a que, si tiene éxito, Matt lo arruine por dinero
Responden que, como es software libre y de código abierto (FOSS), incluso en el peor de los casos la comunidad podría hacer un fork de la última buena versión y seguir desarrollándola
Una postura tajante de que precisamente por ese hecho (que sea un producto de Automattic) no lo usarían
¡Aaah, era 10L, no 10l!