Soy novato en aprendizaje automático y keras y ahora estoy trabajando en un problema de clasificación de imágenes de varias clases usando keras. La entrada es imagen etiquetada. Después de un procesamiento previo, los datos de entrenamiento se representan en la lista de Python como:
[["dog", "path/to/dog/imageX.jpg"],["cat", "path/to/cat/imageX.jpg"], ["bird", "path/to/cat/imageX.jpg"]]
el "perro", el "gato" y el "pájaro" son las etiquetas de clase. Creo que la codificación de un solo uso debería usarse para este problema, pero no tengo muy claro cómo tratarlo con estas etiquetas de cadena. He probado sklearn's LabelEncoder () de esta manera:
encoder = LabelEncoder()
trafomed_label = encoder.fit_transform(["dog", "cat", "bird"])
print(trafomed_label)
Y la salida es [2 1 0], que es diferente a mi salida esperada de algo como [[1,0,0], [0,1,0], [0,0,1]]. Se puede hacer con algo de codificación, pero me gustaría saber si hay alguna forma "estándar" o "tradicional" de manejarlo.