Preguntas etiquetadas con pandas

Pandas es una biblioteca de Python para la manipulación y el análisis de datos, por ejemplo, marcos de datos, series de tiempo multidimensionales y conjuntos de datos transversales que se encuentran comúnmente en estadísticas, resultados de ciencias experimentales, econometría o finanzas. Pandas es una de las principales bibliotecas de ciencia de datos en Python.


5
Agregar fechas faltantes al marco de datos de pandas
Mis datos pueden tener múltiples eventos en una fecha determinada o NO eventos en una fecha. Tomo estos eventos, obtengo un recuento por fecha y los trazo. Sin embargo, cuando los trazo, mis dos series no siempre coinciden. idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max()) s = df.groupby(['simpleDate']).size() En el código anterior, idx …
127 python  date  plot  pandas  dataframe 

8
Utilice .corr para obtener la correlación entre dos columnas
Tengo el siguiente marco de datos de pandas Top15: Creo una columna que estima la cantidad de documentos citables por persona: Top15['PopEst'] = Top15['Energy Supply'] / Top15['Energy Supply per Capita'] Top15['Citable docs per Capita'] = Top15['Citable documents'] / Top15['PopEst'] Quiero saber la correlación entre el número de documentos citables per …

4
tipos de fecha y hora en pandas read_csv
Estoy leyendo en un archivo csv con múltiples columnas de fecha y hora. Necesitaría configurar los tipos de datos al leer el archivo, pero las fechas y horas parecen ser un problema. Por ejemplo: headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None, names=headers, …


6
Cómo mantener el índice al usar pandas merge
Me gustaría fusionar dos DataFramesy mantener el índice del primer fotograma como índice en el conjunto de datos combinado. Sin embargo, cuando hago la fusión, el DataFrame resultante tiene un índice entero. ¿Cómo puedo especificar que quiero mantener el índice del marco de datos izquierdo? In [4]: a = pd.DataFrame({'col1': …
126 python  pandas 

9
Python pandas eliminan columnas duplicadas
¿Cuál es la forma más sencilla de eliminar columnas duplicadas de un marco de datos? Estoy leyendo un archivo de texto que tiene columnas duplicadas a través de: import pandas as pd df=pd.read_table(fname) Los nombres de las columnas son: Time, Time Relative, N2, Time, Time Relative, H2, etc... Todas las …
126 python  pandas 

4
Cómo formar una columna de tupla a partir de dos columnas en Pandas
Tengo un Pandas DataFrame y quiero combinar las columnas 'lat' y 'long' para formar una tupla. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values Location 205482 …



6
Pandas de reemplazo condicional
Tengo un DataFrame y quiero reemplazar los valores en una columna en particular que exceden un valor con cero. Pensé que esta era una forma de lograr esto: df[df.my_channel > 20000].my_channel = 0 Si copio el canal en un nuevo marco de datos, es simple: df2 = df.my_channel df2[df2 > …


8
Pandas groupby: Cómo conseguir una unión de cuerdas
Tengo un marco de datos como este: A B C 0 1 0.749065 This 1 2 0.301084 is 2 3 0.463468 a 3 4 0.643961 random 4 1 0.866521 string 5 2 0.120737 ! Vocación In [10]: print df.groupby("A")["B"].sum() volverá A 1 1.615586 2 0.421821 3 0.463468 4 0.643961 Ahora …
122 python  pandas 



Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.