En general
Su pkl
archivo es, de hecho, un pickle
archivo serializado , lo que significa que se ha descargado utilizando el pickle
módulo de Python .
Para eliminar el encurtido de los datos puede:
import pickle
with open('serialized.pkl', 'rb') as f:
data = pickle.load(f)
Para el conjunto de datos MNIST
La nota gzip
solo es necesaria si el archivo está comprimido:
import gzip
import pickle
with gzip.open('mnist.pkl.gz', 'rb') as f:
train_set, valid_set, test_set = pickle.load(f)
Donde cada conjunto se puede dividir aún más (es decir, para el conjunto de entrenamiento):
train_x, train_y = train_set
Esas serían las entradas (dígitos) y salidas (etiquetas) de sus conjuntos.
Si desea mostrar los dígitos:
import matplotlib.cm as cm
import matplotlib.pyplot as plt
plt.imshow(train_x[0].reshape((28, 28)), cmap=cm.Greys_r)
plt.show()
La otra alternativa sería mirar los datos originales:
http://yann.lecun.com/exdb/mnist/
Pero eso será más difícil, ya que deberá crear un programa para leer los datos binarios en esos archivos. Así que te recomiendo que uses Python y cargues los datos con pickle
. Como has visto, es muy fácil. ;-)