Preguntas etiquetadas con unicode

Unicode es un estándar para la codificación, representación y manejo de texto con la intención de admitir todos los caracteres necesarios para el texto escrito que incorpora todos los sistemas de escritura, símbolos técnicos y signos de puntuación.






4
¿Por qué este código, escrito al revés, imprime "Hello World!"
Aquí hay un código que encontré en Internet: class M‮{public static void main(String[]a‭){System.out.print(new char[] {'H','e','l','l','o',' ','W','o','r','l','d','!'});}} Este código se imprime Hello World!en la pantalla; Puedes verlo correr aquí . Puedo ver claramente public static void mainescrito, pero está al revés. ¿Cómo funciona este código? ¿Cómo se compila esto? Editar: probé …

9
UnicodeDecodeError, byte de continuación no válido
¿Por qué falla el siguiente artículo? ¿Y por qué tiene éxito con el códec "latin-1"? o = "a test of \xe9 char" #I want this to remain a string as this is what I am receiving v = o.decode("utf-8") resultados en: Traceback (most recent call last): File "<stdin>", line 1, …
257 python  unicode  decode 

7
Reemplazar caracteres no ASCII con un solo espacio
Necesito reemplazar todos los caracteres que no sean ASCII (\ x00- \ x7F) con un espacio. Me sorprende que esto no sea fácil en Python, a menos que me falte algo. La siguiente función simplemente elimina todos los caracteres que no son ASCII: def remove_non_ascii_1(text): return ''.join(i for i in …

13
Python: ¿Eliminar \ xa0 de la cadena?
Actualmente estoy usando Beautiful Soup para analizar un archivo HTML y llamar get_text(), pero parece que me quedan muchos \ xa0 Unicode que representan espacios. ¿Hay alguna manera eficiente de eliminarlos en Python 2.7 y cambiarlos a espacios? Supongo que la pregunta más general sería: ¿hay alguna forma de eliminar …
241 python  parsing  unicode 

12
¿Cuántos bytes tiene un carácter Unicode?
Estoy un poco confundido acerca de las codificaciones. Hasta donde yo sé, los caracteres ASCII antiguos tomaban un byte por carácter. ¿Cuántos bytes requiere un carácter Unicode? Supongo que un carácter Unicode puede contener todos los caracteres posibles de cualquier idioma. ¿Estoy en lo correcto? Entonces, ¿cuántos bytes necesita por …

5
¿Cómo puedo cambiar la codificación de un archivo con vim?
Estoy acostumbrado a usar vim para modificar las terminaciones de línea de un archivo: $ file file file: ASCII text, with CRLF line terminators $ vim file :set ff=mac :wq $ file file file: ASCII text, with CR line terminators ¿Es posible utilizar un proceso similar para cambiar la codificación …
235 vim  unicode 


5
¿Cuál es la diferencia entre _tmain () y main () en C ++?
Si ejecuto mi aplicación C ++ con el siguiente método main (), todo está bien: int main(int argc, char *argv[]) { cout << "There are " << argc << " arguments:" << endl; // Loop through each argument and print its number and value for (int i=0; i<argc; i++) cout …
224 c++  unicode  arguments 



Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.