Vi esta pregunta en la propuesta del sitio de Typography y me molestó que no supiera la respuesta. Siempre traté 'glifo' y 'personaje' como intercambiables.
Después de leer una explicación en la página Modelo de codificación de caracteres Unicode , entiendo más o menos esto:
- Los caracteres se definen por su significado en el lenguaje, glifos, por su apariencia . Entonces, la ligadura para la combinación estética
fi
es un glifo, pero dos caracteres.
Entonces, mi creencia es (corríjame si me equivoco) que la diferencia práctica sería:
- Los analizadores de texto que no están interesados en la estética del texto leerán los glifos como sus respectivos caracteres. Asi que:
- Si tuviera que copiar y pegar texto que contenga glifos en un editor de texto sin formato, los glifos se convertirían a sus respectivos caracteres (
fi
se convertiría en un glifo de ligaduraf
yi
) - Cualquier sistema automatizado bien hecho basado en el análisis de texto (por ejemplo, rastreadores de motores de búsqueda, lectores de pantalla, correctores ortográficos) interpretaría los glifos como sus respectivos caracteres.
- Un personaje puede tener muchos glifos o conjuntos de glifos. Quiero decir que un glifo solo puede tener un carácter, pero esto claramente no es correcto, ya que hay un ejemplo en el artículo vinculado de 3 glifos y conjuntos de glifos que parecen corresponder a un carácter y a un conjunto de caracteres. No entiendo cómo podría funcionar esto: ¿seguramente eso significa que habrá inconsistencia o ambigüedad en la forma en que se interpretan esos glifos, que varían según el intérprete? (¿o varía según el idioma o la fuente?)
- Mientras que los navegadores de glifos (por ejemplo, el de Illustrator) contienen el conjunto completo de glifos de una fuente, los mapas de caracteres (por ejemplo, el mapa de caracteres de Windows) solo contienen caracteres, no glifos que son múltiples caracteres como ligaduras (algo que no había notado antes)
- Si tuviera que copiar y pegar texto que contenga glifos en un editor de texto sin formato, los glifos se convertirían a sus respectivos caracteres (
Siento que estoy a punto de llegar, pero claramente he entendido mal algo en algún punto: no solo lo de "Un glifo de múltiples caracteres", sino también, copiar y pegar el comportamiento con ligaduras no es exactamente lo que esperaba:
- Copie la ligadura
fi
de Illustrator en este cuadro de entrada: pega comofi
(dos caracteres) como se esperaba. - Pegue el código HTML para ello (
fi
): se muestra como la ligadura cuando no está en un bloque de código (fi - que en esta fuente no se parece mucho a una ligadura, pero verá que es una si intenta seleccionar solo la mitad de él), y el código cuando está en un bloque de código (fi
), como se esperaba. - Copie y pegue la ligadura representada sin bloque de código en el cuadro de entrada: se pega como el carácter de ligadura y se representa como la ligadura independientemente de si está en un bloque de código o no (fi y
fi
). Del mismo modo, las palabras que lo contienen: fit tt mistits (fit misfits
) se pegan como tt mistiets (fit misfits
). ¿Quizás depende de si el lugar donde se está pegando comprende la codificación utilizada?
¿Cuán equivocado está mi entendimiento de esto? ¿Alguien puede corregirme: establecer una definición clara de la diferencia entre los glifos y los caracteres (si el mío es incorrecto o puede mejorarse), y dar ejemplos más claros / precisos que el mío de lo que eso significa en la práctica ?