El b
prefijo significa una bytes
cadena literal .
Si ve que se usa en el código fuente de Python 3, la expresión crea un bytes
objeto , no un objeto Unicodestr
normal . Si ve que se repite en su shell de Python o como parte de una lista, dict u otro contenido del contenedor, entonces verá un bytes
objeto representado usando esta notación.
bytes
Los objetos contienen básicamente una secuencia de números enteros en el rango 0-255, pero cuando se representan, Python muestra estos bytes como puntos de código ASCII para facilitar la lectura de su contenido. Cualquier bytes fuera de la imprimible gama de caracteres ASCII se muestran como secuencias de escape (por ejemplo \n
, \x82
, etc.). A la inversa, puede utilizar tanto caracteres ASCII como secuencias de escape para definir valores de bytes; para valores ASCII se usa su valor numérico (por ejemplo, b'A'
== b'\x41'
)
Dado que un bytes
objeto consta de una secuencia de números enteros, puede construir un bytes
objeto a partir de cualquier otra secuencia de números enteros con valores en el rango 0-255, como una lista:
bytes([72, 101, 108, 108, 111])
y la indexación le devuelve los enteros (pero la división produce un nuevo bytes
valor; para el ejemplo anterior, value[0]
le da 72
, pero value[:1]
es b'H'
como 72 es el punto de código ASCII para la letra H mayúscula ).
bytes
modelar datos binarios , incluido el texto codificado . Si su bytes
valor contiene texto, primero debe decodificarlo con el códec correcto. Si los datos están codificados como UTF-8, por ejemplo, puede obtener un str
valor Unicode con:
strvalue = bytesvalue.decode('utf-8')
Por el contrario, para pasar del texto de un str
objeto a bytes
tener que codificar . Debe decidir qué codificación utilizar; el valor predeterminado es usar UTF-8, pero lo que necesitará depende en gran medida de su caso de uso:
bytesvalue = strvalue.encode('utf-8')
También puedes usar el constructor bytes(strvalue, encoding)
para hacer lo mismo.
Tanto el método de decodificación como el de codificación toman un argumento adicional para especificar cómo se deben manejar los errores .
Python 2, las versiones 2.6 y 2.7 también admiten la creación de literales de cadena utilizando b'..'
la sintaxis de literal de cadena, para facilitar el código que funciona tanto en Python 2 como en 3.
bytes
los objetos son inmutables, al igual que las str
cadenas. Utilice un bytearray()
objeto si necesita tener un valor de bytes mutable.