Conjunto de caracteres
Un conjunto de caracteres es una colección de caracteres, a cada uno de los cuales se le asigna un número.
Un conjunto de caracteres bien conocido es ASCII. Este es un conjunto de 128 caracteres numerados del 0 al 127. Todos estos números se pueden expresar en 7 bits (por lo tanto, es un conjunto de caracteres de 7 bits)
La mayoría, pero no todos los demás juegos de caracteres, incluyen el juego ASCII con la misma numeración. Los ejemplos de conjuntos de caracteres que no son como ASCII incluyen EBCDIC. También hubo variantes europeas en ASCII que tenían caracteres diferentes en ciertas posiciones (por ejemplo, para incluir £)
Codificaciones
Los conjuntos de caracteres grandes como Unicode, con más de un millón de caracteres, requerirían tres o cuatro bytes por carácter para acomodar el amplio rango de números que se han asignado a los caracteres. En su lugar, utilizan un sistema que permite que ese número se "codifique" como uno, dos, tres o más bytes. Con el esquema de codificación UTF-8, los caracteres que son los mismos que los caracteres ASCII se codifican con bytes individuales con el mismo valor de byte que en ASCII.
Las codificaciones anteriores se utilizan al almacenar texto en archivos.
Tipos de letra
Un tipo de letra es un diseño específico de la representación visual (es decir, la forma) de un conjunto de caracteres. Las formas se llaman glifos. Un tipo de letra puede tener varios glifos para un carácter (considere "a"). Puede tener glifos para pares de caracteres llamados ligaduras (por ejemplo, "ff" o "fi"). En un tipo de letra, el conjunto de caracteres para el que se diseñó un glifo, por lo tanto, a menudo difiere del conjunto de caracteres en conjuntos de caracteres conocidos (los tipos de letra generalmente no incluyen glifos para los caracteres de control ASCII).
Fuentes
En el contexto de las computadoras, una fuente significa un archivo que contiene glifos ordenados de acuerdo con algún esquema de numeración (que a menudo no es lo mismo que la numeración en cualquier conjunto de caracteres conocido). Históricamente, había fuentes con mapas de bits que representaban un tamaño específico (en píxeles o puntos) de un tipo de letra. Actualmente, la mayoría de las fuentes usan curvas matemáticas para describir glifos y, por lo tanto, se pueden escalar para representar cualquier tamaño de letra.
Poniendolo todo junto
Cuando visualiza un archivo de texto, se le debe decir a la computadora (o adivinar) la codificación utilizada en el archivo. Luego usará una numeración diferente (por ejemplo, una variante de Unicode de 16 bits) para representar el texto en la memoria, luego usará información en un archivo de fuente para asignar la representación interna a la numeración (codificación) utilizada en el archivo de fuente.