elbird - paquete envoltorio de R para kiwi, un analizador morfológico de coreano (github.com)
(github.com/mrchypark)elbird es, en lo personal, el paquete que representa la meta final de kiwigo, que publiqué anteriormente.
En R, el panorama de paquetes de análisis morfológico está básicamente dividido entre KoNLP (basado en Java, actualmente * retirado de CRAN) y RcppMecab (basado en mecab, rápido, pero no reconstruye el texto original), además de algunos otros paquetes.
En una situación donde KoNLP era la opción principal, la dificultad de instalar el JDK y el hecho de que ya no está en CRAN coincidieron, así que he estado esforzándome por subir a CRAN un nuevo paquete de análisis morfológico que sea fácil de instalar y que siga teniendo mantenimiento continuo.
Fue entonces cuando conocí kiwi, que se está desarrollando en cpp y tiene una portabilidad excelente.
Después de mucho tiempo, por fin pude crear un paquete de R envolviendo sus funciones de cpp y completar su registro en CRAN.
Actualmente está registrada la versión 0.1.1, y planeo actualizarla pronto a la 0.1.2.
Las funciones implementadas hasta ahora están en un nivel que permite un uso básico, y después de implementar todas las funciones de kiwi, quiero trabajar en alinearlo con la versión de kiwi.
En el readme hay ejemplos básicos de código de uso, y también se han considerado funciones para usarlo junto con tidytext, un conocido paquete de análisis de texto del ecosistema de R.
Les agradeceré mucho su interés.
* CRAN: el repositorio oficial de paquetes de R. Es un repositorio administrado que pasa por pruebas automáticas y revisión de administradores, y sigue una política evergreen (si fallan las pruebas, se cancela el registro), por lo que requiere mantenimiento constante.
1 comentarios
Tengo poca experiencia con el desarrollo en C++ y la compilación, así que también necesito mucha ayuda al respecto.
Si hay alguien que pueda darme consejos, les agradecería que revisaran la pestaña de issues.