Supongamos que tengo un marco de datos con países que va como:
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
Sé que hay una función pd.get_dummies para convertir los países a 'codificaciones one-hot'. Sin embargo, deseo convertirlos en índices en su lugar, de modo que obtengo en su cc_index = [1,2,1,3]
lugar.
Supongo que hay una forma más rápida que usar get_dummies junto con una cláusula where numpy como se muestra a continuación:
[np.where(x) for x in df.cc.get_dummies().values]
Esto es algo más fácil de hacer en R usando 'factores', así que espero que los pandas tengan algo similar.
cc_index = [0,1,0,2]
?