Preguntas etiquetadas con utf-8

UTF-8 es una codificación de caracteres que describe cada punto de código Unicode utilizando una secuencia de bytes de uno a cuatro bytes. Es compatible con versiones anteriores de ASCII y, al mismo tiempo, admite la representación de todos los puntos de código Unicode.

14
Unicode (UTF-8) leyendo y escribiendo en archivos en Python
Tengo algunos problemas cerebrales para entender leer y escribir texto en un archivo (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) ("u'Capit \ xe1n '", "' Capit \ xc3 \ xa1n '") print ss, ss8 print >> open('f1','w'), ss8 …
330 python  unicode  utf-8  io 

24
Detecta la codificación y crea todo UTF-8
Estoy leyendo muchos textos de varios canales RSS y los inserto en mi base de datos. Por supuesto, hay varias codificaciones de caracteres diferentes utilizadas en las fuentes, por ejemplo, UTF-8 e ISO 8859-1. Desafortunadamente, a veces hay problemas con las codificaciones de los textos. Ejemplo: El "ß" en "Fußball" …

5
UTF-8: ¿General? ¿Compartimiento? Unicode?
Estoy tratando de averiguar qué cotejo debería usar para varios tipos de datos. El 100% del contenido que almacenaré es enviado por el usuario. Tengo entendido que debería usar UTF-8 General CI (mayúsculas y minúsculas) en lugar de UTF-8 Binary. Sin embargo, no puedo encontrar una distinción clara entre UTF-8 …
279 mysql  utf-8  collation 




2
Urd decodificar UTF-8 en Python
He pasado mucho tiempo hasta donde soy novato en Python. ¿Cómo podría decodificar una URL así? example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 a este en python 2.7: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8")) está devolviendo algo muy feo. Todavía no hay solución, se agradece cualquier ayuda.

11
UTF-8 byte [] a String
Supongamos que acabo de utilizar a BufferedInputStreampara leer los bytes de un archivo de texto codificado UTF-8 en una matriz de bytes. Sé que puedo usar la siguiente rutina para convertir los bytes en una cadena, pero ¿hay una manera más eficiente / inteligente de hacer esto que simplemente iterar …
243 java  utf-8 

17
¿"Valor de cadena incorrecto" al intentar insertar UTF-8 en MySQL a través de JDBC?
Así es como se establece mi conexión: Connection conn = DriverManager.getConnection(url + dbName + "?useUnicode=true&characterEncoding=utf-8", userName, password); Y obtengo el siguiente error al intentar agregar una fila a una tabla: Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...' for column 'content' at row 1 Estoy insertando miles de registros, y siempre recibo este error …
228 mysql  jdbc  utf-8  utf8mb4 

16
¿Realmente necesito codificar '&' como '& amp;'?
Estoy usando un &símbolo ' ' con HTML5 y UTF-8 en mi sitio <title>. Google muestra el ampersand bien en sus SERPs, al igual que todos los navegadores en sus títulos. http://validator.w3.org me está dando esto: & no inició una referencia de caracteres. (Y probablemente debería haberse escapado como &.) …

4
Escribir en el archivo UTF-8 en Python
Estoy realmente confundido con el codecs.open function. Cuando lo hago: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Me da el error UnicodeDecodeError: el códec 'ascii' no puede decodificar el byte 0xef en la posición 0: el ordinal no está en el rango (128) Si lo hago: file = open("temp", "w") …


12
PHP DOMDocument loadHTML no codifica UTF-8 correctamente
Estoy tratando de analizar algo de HTML usando DOMDocument, pero cuando lo hago, de repente pierdo mi codificación (al menos así es como me parece). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } El resultado de este …

9
Cómo convertir una cadena a utf-8 en Python
Tengo un navegador que envía caracteres utf-8 a mi servidor Python, pero cuando lo recupero de la cadena de consulta, la codificación que Python devuelve es ASCII. ¿Cómo puedo convertir la cadena simple a utf-8? NOTA: La cadena que se pasa de la web ya está codificada en UTF-8, solo …


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.