Estoy usando pandas como sustituto de db, ya que tengo varias bases de datos (oracle, mssql, etc.) y no puedo hacer una secuencia de comandos para un equivalente de SQL.
Tengo una tabla cargada en un DataFrame con algunas columnas:
YEARMONTH, CLIENTCODE, SIZE, .... etc etc
En SQL, contar la cantidad de clientes diferentes por año sería:
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
Y el resultado sería
201301 5000
201302 13245
¿Cómo puedo hacer eso en pandas?
value_counts
podría ser la respuesta que está buscando: pandas.pydata.org/pandas-docs/stable/generated/…