Estoy creando un programa de conteo de palabras simple en Java que lee los archivos basados en texto de un directorio.
Sin embargo, sigo recibiendo el error:
java.nio.charset.MalformedInputException: Input length = 1
de esta línea de código:
BufferedReader reader = Files.newBufferedReader(file,Charset.forName("UTF-8"));
Sé que probablemente entiendo esto porque utilicé un Charset
que no incluía algunos de los caracteres en los archivos de texto, algunos de los cuales incluían caracteres de otros idiomas. Pero quiero incluir esos personajes.
Más tarde supe en JavaDocs que Charset
es opcional y solo se usa para una lectura más eficiente de los archivos, así que cambié el código a:
BufferedReader reader = Files.newBufferedReader(file);
Pero algunos archivos todavía arrojan el MalformedInputException
. No sé por qué.
Me preguntaba si hay un todo incluido Charset
que me permita leer archivos de texto con muchos tipos diferentes de caracteres .
Gracias.
ISO-8859-1
y funciona bien. Creo que es para personajes europeos, lo cual está bien. Sin embargo, todavía no sé por quéUTF-16
no funciona.