Preguntas etiquetadas con character-encoding

Preguntas que tratan con varias representaciones de caracteres y conjuntos de caracteres, tales como: ASCII, UTF-8, EBCDIC, entre otros. A menudo se encuentra al mover archivos entre sistemas operativos que codifican nuevas líneas con retornos de carro y / o caracteres de nueva línea.



2
¿Por qué wc -m y wc -c son diferentes?
Como programador en C, me sorprendió ver que wc -c(que cuenta la cantidad de bytes) y wc -m(que cuenta la cantidad de caracteres) genera resultados muy diferentes para un archivo de texto largo mío. Siempre me dijeron que sizeof(char)es 1 byte. qdii@nomada ~/Documents $ wc -c sentences.csv 102990983 sentences.csv qdii@nomada …

2
¿Qué codificaciones de caracteres son compatibles con posix?
POSIX define el comportamiento de herramientas tales como grep, awk, sed,, etc, que trabajan contra los archivos de texto. Como se trata de un archivo de texto, creo que existen los problemas de codificación de caracteres. Pregunta: ¿Cuáles son las codificaciones de caracteres compatibles con POSIX? (¿o archivos de texto …

4
soporte para codificación utf-8 con lpr
Al intentar enviar un archivo de texto a la impresora a través lprde xterm, el contenido se corrompió más allá del reconocimiento, cuya causa se rastreó en última instancia hasta la codificación del archivo. Si, en cambio, proceso el texto con iconv(por ejemplo, iconv -f utf-8 -t ascii//TRANSLIT), entonces el …

2
terminal: muestra caracteres especiales
En algunos programas, como htoplas líneas y los marcos, no se muestran correctamente. En cambio, se muestran como -y /. Pero en otra máquina, se muestran correctamente como líneas adecuadas: No estoy seguro de si se trata de un problema terminal, o si quizás algún paquete es necesario. En caso …




4
¿Cómo puedo identificar un personaje extraño?
Estoy tratando de identificar un personaje extraño que he encontrado en un archivo con el que estoy trabajando: $ cat file � $ od file 0000000 005353 0000002 $ od -c file 0000000 353 \n 0000002 $ od -x file 0000000 0aeb 0000002 El archivo está usando la codificación ISO-8859 …






Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.