Preguntas etiquetadas con unicode

Unicode es un estándar para la codificación, representación y manejo de texto con la intención de admitir todos los caracteres necesarios para el texto escrito que incorpora todos los sistemas de escritura, símbolos técnicos y signos de puntuación.

6
Problema de codificación de Java FileReader
Intenté usar java.io.FileReader para leer algunos archivos de texto y convertirlos en una cadena, pero descubrí que el resultado está codificado incorrectamente y no es legible en absoluto. Aquí está mi entorno: Windows 2003, codificación del sistema operativo: CP1252 Java 5.0 Mis archivos están codificados en UTF-8 o CP1252, y …
130 java  file  unicode  encoding 


7
¿De qué se trata el UTF-8 normalizado?
El proyecto ICU (que ahora también tiene una biblioteca PHP ) contiene las clases necesarias para ayudar a normalizar las cadenas UTF-8 para facilitar la comparación de valores al buscar. Sin embargo, estoy tratando de averiguar qué significa esto para las aplicaciones. Por ejemplo, ¿en qué casos quiero "Equivalencia canónica" …

8
¿Qué es el código de caracteres HTML 8203?
¿Qué significa el código de caracteres (HTML) ​? Lo encontré en uno de mis scripts de jQuery y me pregunté qué era ... Gracias. Editar: Aquí está el script en el que estaba (se agregó al final, lo encontré en Firebug) <script src="http://code.jquery.com/jquery-latest.js" type="text/javascript"></script> <script type="text/javascript"> var $jnyh = jQuery.noConflict(); …


3
¿Equivalentes Unicode para \ w y \ b en expresiones regulares de Java?
Muchas implementaciones modernas de expresiones regulares interpretan la \wtaquigrafía de la clase de caracteres como "cualquier letra, dígito o puntuación de conexión" (generalmente: subrayado). De esta manera, una expresión regular como \w+los partidos palabras como hello, élève, GOÄ_432o gefräßig. Desafortunadamente, Java no lo hace. En Java, \wse limita a [A-Za-z0-9_]. …





6
¿Cómo puedo generar UTF-8 desde Perl?
Estoy intentando escribir un script en Perl usando el pragma "utf8" y obtengo resultados inesperados. Estoy usando Mac OS X 10.5 (Leopard) y estoy editando con TextMate. Todas mis configuraciones tanto para mi editor como para mi sistema operativo están predeterminadas para escribir archivos en formato utf-8. Sin embargo, cuando …
110 perl  unicode  utf-8 



5
¿Cuál es la forma correcta de codificar en URL los caracteres Unicode?
Conozco el esquema% uxxxx no estándar, pero no parece una elección acertada ya que el esquema ha sido rechazado por el W3C. Algunos ejemplos interesantes: El personaje del corazón. Si escribo esto en mi navegador: http://www.google.com/search?q=♥ Luego cópielo y péguelo, veo esta URL http://www.google.com/search?q=%E2%99%A5 lo que hace que parezca que …


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.