Preguntas etiquetadas con unicode

Unicode es un estándar para la codificación, representación y manejo de texto con la intención de admitir todos los caracteres necesarios para el texto escrito que incorpora todos los sistemas de escritura, símbolos técnicos y signos de puntuación.





12
UTF-8, UTF-16 y UTF-32
¿Cuáles son las diferencias entre UTF-8, UTF-16 y UTF-32? Entiendo que todos almacenarán Unicode, y que cada uno usa un número diferente de bytes para representar un carácter. ¿Hay alguna ventaja en elegir uno sobre el otro?
487 unicode  utf-8  utf-16  utf  utf-32 

12
Guardar textos utf-8 en json.dumps como UTF8, no como \ u secuencia de escape
Código de muestra: >>> import json >>> json_string = json.dumps("ברי צקלה") >>> print json_string "\u05d1\u05e8\u05d9 \u05e6\u05e7\u05dc\u05d4" El problema: no es legible para humanos. Mis usuarios (inteligentes) quieren verificar o incluso editar archivos de texto con volcados JSON (y prefiero no usar XML). ¿Hay alguna manera de serializar objetos en cadenas …
474 python  json  unicode  utf-8  escaping 

30
La mejor manera de revertir una cadena
Solo tuve que escribir una función inversa de cadena en C # 2.0 (es decir, LINQ no está disponible) y se me ocurrió esto: public string Reverse(string text) { char[] cArray = text.ToCharArray(); string reverse = String.Empty; for (int i = cArray.Length - 1; i > -1; i--) { reverse …

18
UnicodeDecodeError al leer el archivo CSV en Pandas con Python
Estoy ejecutando un programa que procesa 30,000 archivos similares. Un número aleatorio de ellos se detiene y produce este error ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", …


9
¿Qué es Unicode, UTF-8, UTF-16?
¿Cuál es la base de Unicode y por qué la necesidad de UTF-8 o UTF-16? Investigué esto en Google y busqué aquí también, pero no me queda claro. En VSS al hacer una comparación de archivos, a veces hay un mensaje que dice que los dos archivos tienen UTF diferentes. …

5
¿Por qué 2+ 40 es igual a 42?
Estaba desconcertado cuando un colega me mostró esta línea de alertas de JavaScript 42. alert(2+ 40); Ejecutar fragmento de códigoHide resultsExpandir fragmento Resulta rápidamente que lo que parece un signo menos es en realidad un personaje arcano de Unicode con una semántica claramente diferente. Esto me dejó preguntándome por qué …

11
¿Cómo hago grep para todos los caracteres no ASCII?
Tengo varios archivos XML muy grandes y estoy tratando de encontrar las líneas que contienen caracteres no ASCII. He intentado lo siguiente: grep -e "[\x{00FF}-\x{FFFF}]" file.xml Pero esto devuelve todas las líneas del archivo, independientemente de si la línea contiene un carácter en el rango especificado. ¿Tengo la sintaxis incorrecta …
359 regex  unix  unicode  grep 


6
Cómo encontrar la longitud de una cadena en R
¿Cómo encontrar la longitud de una cadena (número de caracteres en una cadena) sin dividirla en R? Sé cómo encontrar la longitud de una lista pero no de una cadena. ¿Y qué hay de las cadenas Unicode? ¿Cómo encuentro la longitud (en bytes) y el número de caracteres (runas, símbolos) …

14
Unicode (UTF-8) leyendo y escribiendo en archivos en Python
Tengo algunos problemas cerebrales para entender leer y escribir texto en un archivo (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) ("u'Capit \ xe1n '", "' Capit \ xc3 \ xa1n '") print ss, ss8 print >> open('f1','w'), ss8 …
330 python  unicode  utf-8  io 

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.