La pandas
drop_duplicates
función es excelente para "uniquificar" un marco de datos. Sin embargo, uno de los argumentos de palabras clave para pasar es take_last=True
o take_last=False
, aunque me gustaría descartar todas las filas que están duplicadas en un subconjunto de columnas. es posible?
A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A
A modo de ejemplo, me gustaría dejar las filas que coinciden en columnas A
y C
por lo que este debe caer filas 0 y 1.