Los caracteres especiales en la entrada de hunspell se tratan como espacio


1

Estoy probando hunspell en la línea de comando con un diccionario sueco. La entrada en el modo interactivo reemplaza todos los caracteres especiales (por ejemplo å ä ö) con espacios en blanco antes de la corrección ortográfica.

Hunspell 1.3.2
sjögräs
& sj 15 0: SJ, aj, dj, sk, s, j, sej, sju, sjö, sjå, sa, se, ej, st, si
& gr 15 3: ge, g, r, ger, gir, gro, gör, grå, går, gry, er, nr, dr, go, kr
*

sj gr s
& sj 15 0: SJ, aj, dj, sk, s, j, sej, sju, sjö, sjå, sa, se, ej, st, si
& gr 15 3: ge, g, r, ger, gir, gro, gör, grå, går, gry, er, nr, dr, go, kr
*

Como puede ver, la codificación de la solicitud está funcionando, mostrando å ä y ö tanto en la entrada como en la salida.

La tubería da el mismo resultado:

echo sjögräs | hunspell -d sv_SE

He tratado de dar diferentes opciones para hunspell, entre ellos -i UTF-8, -i UTF-16y mantener el archivo de aff SET ISO8859-1. Nada funcionó.

Lo mismo sucede con el francés:

C:\Users\gauthier>echo résultat | hunspell -d fr-moderne
Hunspell 1.3.2
*
& sultat 2 2: sultan, rAcsultat

con además problemas con la salida.

Compilé hunspell en MinGW y moví los archivos necesarios resultantes a algún lugar en mi camino, pero no creo que esta información sea muy relevante.

¿Cómo hago para que hunspell reconozca caracteres especiales en su entrada?

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.