Me parece una gran cosa divertida para pensar. Binario no es 1s y 0s en la forma en que lo hablas.
Imagina que hay una cantidad, puedo decirte qué cantidad es de muchas maneras diferentes:
Nine
en inglés
Neuf
en francés
9
en números arábigos
IX
en números romanos
1001
en binario con números arábigos
on off off on
en binario con encendido / apagado
high low low high
en binario representado con voltajes o palancas o niveles de agua o carga eléctrica ... o palabras en inglés 'alto' y 'bajo'
Todos representan lo mismo. El punto aquí es que el binario no es 1s y 0s, esa es solo una forma de representar un valor.
Cuando habla de convertir una H en binario, probablemente imagina ver 10101010 en la pantalla, pero eso no es "binario", es un dígito para cada bit binario.
Sí, si convertiste H
a "binario" como la gente normalmente habla de ello, y luego lo representaste en dígitos arábigos y luego lo almacenaste, ocuparía más espacio de la misma manera que la conversión H
a aitch
ocupa más espacio.
Pero se puede ver que el binario es una forma de representar una cantidad, bien por esa lógica que dice "si convirtiera H en binario y lo representara como high low high low high low high low
entonces, ¡tomaría 35 caracteres! ¡Eso es aún más 10101010
! Pero estos dos son 'binarios' .. Entonces, ¿cómo es uno más grande que el otro?
La otra cara de esto es que preguntarse cómo H
se almacena por un ordenador, y para ver que H
es en sí mismo sólo una forma de representar una cantidad - la misma cantidad 72
, 01001000
o seventy two
o código de caracteres ASCII H
. Cuál es la respuesta de 8bittree de que el texto plano es binario, pero este soy yo tratando de mostrar lo que eso significa .
Entonces obtienes un patrón de bits en una computadora 01001000
y ¿qué significa? Cualquier cosa: podría hablarse como un número, como parte de un archivo zip, como un personaje, depende de la intención de la persona que lo creó. Si sabe que se supone que es texto sin formato, proviene de una codificación de caracteres H
-> 01001000
y lo busca en la tabla de codificación de caracteres: ASCII, UTF-8, shift-jis, etc. y encuentra la fuente correcta personaje y sale un H
o lo que sea. O sale el carácter incorrecto si utiliza una búsqueda de codificación diferente a la utilizada por la persona que la creó. Este es el enlace de @Eric Lippert.
Pero mientras escribo esto, y como lo piensas, H
es un byte y 01001000
tiene 8 bytes, sí, eso es más espacio. Y sí, es (una representación de) binario. Pero está en un nivel de abstracción más alto que el que usa la computadora: binario mostrado en caracteres ASCII, donde cada personaje se representa detrás de escena con un patrón de bits binarios, cada uno tan grande como el H
único.