Preguntas etiquetadas con pandas

Pandas es una biblioteca de Python para la manipulación y el análisis de datos, por ejemplo, marcos de datos, series de tiempo multidimensionales y conjuntos de datos transversales que se encuentran comúnmente en estadísticas, resultados de ciencias experimentales, econometría o finanzas. Pandas es una de las principales bibliotecas de ciencia de datos en Python.

4
Pandas de Python: llenar un marco de datos fila por fila
La simple tarea de agregar una fila a un pandas.DataFrameobjeto parece ser difícil de lograr. Hay 3 preguntas de stackoverflow relacionadas con esto, ninguna de las cuales da una respuesta funcional. Esto es lo que estoy tratando de hacer. Tengo un DataFrame del que ya conozco la forma, así como …
133 python  dataframe  row  pandas 

13
Cómo imprimir un objeto groupby
Quiero imprimir el resultado de la agrupación con Pandas. Tengo un marco de datos: import pandas as pd df = pd.DataFrame({'A': ['one', 'one', 'two', 'three', 'three', 'one'], 'B': range(6)}) print(df) A B 0 one 0 1 one 1 2 two 2 3 three 3 4 three 4 5 one 5 …
133 python  pandas 



5
Normalizar datos en pandas
Supongamos que tengo un marco de datos de pandas df: Quiero calcular la columna sabia media de un marco de datos. Esto es facil: df.apply(average) entonces el rango sabio de columna max (col) - min (col). Esto es fácil nuevamente: df.apply(max) - df.apply(min) Ahora, para cada elemento, quiero restar la …
131 python  pandas  numpy 


3
¿Cuál es la forma más eficiente de contar las ocurrencias en los pandas?
Tengo un gran marco de datos (aproximadamente 12 millones de filas) df con decir: df.columns = ['word','documents','frequency'] Entonces lo siguiente se ejecutó de manera oportuna: word_grouping = df[['word','frequency']].groupby('word') MaxFrequency_perWord = word_grouping[['frequency']].max().reset_index() MaxFrequency_perWord.columns = ['word','MaxFrequency'] Sin embargo, esto tarda un tiempo inesperado en ejecutarse: Occurrences_of_Words = word_grouping[['word']].count().reset_index() ¿Qué estoy haciendo mal …
131 python  pandas 

13
¿Cómo mostrar el nombre de todas las columnas en el marco de datos de pandas?
Tengo un marco de datos que consta de cientos de columnas y necesito ver todos los nombres de las columnas. Lo que hice: In[37]: data_all2.columns La salida es: Out[37]: Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food', 'government', 'internet', 'isipulsa', ... 'overdue_3months_feature78', 'overdue_3months_feature79', 'overdue_3months_feature80', 'overdue_3months_feature81', 'overdue_3months_feature82', 'overdue_3months_feature83', 'overdue_3months_feature84', 'overdue_3months_feature85', 'overdue_3months_feature86', 'loan_overdue_3months_total_y'], …
131 python  pandas  dataframe  show 

2
verificar si la variable es dataframe
cuando se llama a mi función f con una variable, quiero verificar si var es un marco de datos de pandas: def f(var): if var == pd.DataFrame(): print "do stuff" Supongo que la solución podría ser bastante simple, pero incluso con def f(var): if var.values != None: print "do stuff" …
130 python  pandas 

6
Cómo verificar el tipo de columna en los pandas de Python
Necesito usar diferentes funciones para tratar columnas numéricas y columnas de cadena. Lo que estoy haciendo ahora es realmente tonto: allc = list((agg.loc[:, (agg.dtypes==np.float64)|(agg.dtypes==np.int)]).columns) for y in allc: treat_numeric(agg[y]) allc = list((agg.loc[:, (agg.dtypes!=np.float64)&(agg.dtypes!=np.int)]).columns) for y in allc: treat_str(agg[y]) ¿Hay alguna forma más elegante de hacer esto? P.ej for y in …
130 python  pandas 




7
Eliminar la columna de índice en pandas al leer un csv
Tengo el siguiente código que importa un archivo CSV. Hay 3 columnas y quiero establecer las dos primeras en variables. Cuando configuro la segunda columna a la variable "eficiencia", la columna de índice también se agrega. ¿Cómo puedo deshacerme de la columna de índice? df = pd.DataFrame.from_csv('Efficiency_Data.csv', header=0, parse_dates=False) energy …
128 python  pandas 


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.