Tengo problemas para leer un archivo, procesar su cadena y guardarlo en un archivo UTF-8.
Aquí está el código:
try:
filehandle = open(filename,"r")
except:
print("Could not open file " + filename)
quit()
text = filehandle.read()
filehandle.close()
Luego hago un poco de procesamiento en el texto variable.
Y entonces
try:
writer = open(output,"w")
except:
print("Could not open file " + output)
quit()
#data = text.decode("iso 8859-15")
#writer.write(data.encode("UTF-8"))
writer.write(text)
writer.close()
Esto genera el archivo perfectamente, pero lo hace en iso 8859-15 según mi editor. Dado que el mismo editor reconoce el archivo de entrada (en el nombre de archivo variable) como UTF-8, no sé por qué sucedió esto. Por lo que mi investigación ha demostrado, las líneas comentadas deberían resolver el problema. Sin embargo, cuando utilizo esas líneas, el archivo resultante tiene un galimatías en caracteres especiales principalmente, palabras con tilde ya que el texto está en español. Realmente agradecería cualquier ayuda ya que estoy perplejo ...