Podrías usar np.where . Si cond
es una matriz booleana y A
y B
son matrices, entonces
C = np.where(cond, A, B)
define C como igual a A
donde cond
es Verdadero y B
donde cond
es Falso.
import numpy as np
import pandas as pd
a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']]
df = pd.DataFrame(a, columns=['one', 'two', 'three'])
df['que'] = np.where((df['one'] >= df['two']) & (df['one'] <= df['three'])
, df['one'], np.nan)
rendimientos
one two three que
0 10 1.2 4.2 10
1 15 70 0.03 NaN
2 8 5 0 NaN
Si tiene más de una condición, puede usar np.select en su lugar. Por ejemplo, si desea df['que']
igualar df['two']
cuándo df['one'] < df['two']
, entonces
conditions = [
(df['one'] >= df['two']) & (df['one'] <= df['three']),
df['one'] < df['two']]
choices = [df['one'], df['two']]
df['que'] = np.select(conditions, choices, default=np.nan)
rendimientos
one two three que
0 10 1.2 4.2 10
1 15 70 0.03 70
2 8 5 0 NaN
Si podemos suponer que df['one'] >= df['two']
when df['one'] < df['two']
es False, entonces las condiciones y opciones podrían simplificarse a
conditions = [
df['one'] < df['two'],
df['one'] <= df['three']]
choices = [df['two'], df['one']]
(La suposición puede no ser cierta si df['one']
o df['two']
contiene NaN).
Tenga en cuenta que
a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']]
df = pd.DataFrame(a, columns=['one', 'two', 'three'])
define un DataFrame con valores de cadena. Dado que parecen numéricos, es mejor que convierta esas cadenas en flotantes:
df2 = df.astype(float)
Sin embargo, esto cambia los resultados, ya que las cadenas comparan carácter por carácter, mientras que los flotantes se comparan numéricamente.
In [61]: '10' <= '4.2'
Out[61]: True
In [62]: 10 <= 4.2
Out[62]: False
if
declaración esFalse
?