Tengo un marco de datos con valores de repetición en la columna A. Quiero eliminar duplicados, manteniendo la fila con el valor más alto en la columna B.
Así que esto:
A B
1 10
1 20
2 30
2 40
3 10
Debería convertirse en esto:
A B
1 20
2 40
3 10
Wes ha agregado una buena funcionalidad para eliminar duplicados: http://wesmckinney.com/blog/?p=340 . Pero AFAICT, está diseñado para duplicados exactos, por lo que no se mencionan los criterios para seleccionar qué filas se mantienen.
Supongo que probablemente haya una manera fácil de hacer esto, tal vez tan fácil como ordenar el marco de datos antes de soltar duplicados, pero no conozco la lógica interna de groupby lo suficientemente bien como para descubrirlo. ¿Alguna sugerencia?