Estoy buscando una forma de hacer el equivalente al SQL
SELECT DISTINCT col1, col2 FROM dataframe_table
La comparación de pandas sql no tiene nada sobre distinct
.
.unique()
solo funciona para una sola columna, así que supongo que podría concaminar las columnas, o ponerlas en una lista / tupla y comparar de esa manera, pero esto parece algo que los pandas deberían hacer de una manera más nativa.
¿Me estoy perdiendo algo obvio o no hay forma de hacer esto?
df.apply(pd.Series.unique)
pero esto no funcionará si el número de valores únicos varía entre las columnas, por lo que tendrá que construir un dictado de los nombres de las columnas como claves y los valores únicos como valores