Me gustaría filtrar filas por una función de cada fila, por ejemplo
def f(row):
return sin(row['velocity'])/np.prod(['masses']) > 5
df = pandas.DataFrame(...)
filtered = df[apply_to_all_rows(df, f)]
O para otro ejemplo más complejo y artificial,
def g(row):
if row['col1'].method1() == 1:
val = row['col1'].method2() / row['col1'].method3(row['col3'], row['col4'])
else:
val = row['col2'].method5(row['col6'])
return np.sin(val)
df = pandas.DataFrame(...)
filtered = df[apply_to_all_rows(df, g)]
¿Como lo puedo hacer?
apply
en esta situación. Un índice booleano normal funcionará bien.df[df['b] > df['c']]
. Hay muy pocas situaciones que realmente lo requieranapply
e incluso pocas que lo necesiten conaxis=1