Preguntas etiquetadas con pandas

Pandas es una biblioteca de Python para la manipulación y el análisis de datos, por ejemplo, marcos de datos, series de tiempo multidimensionales y conjuntos de datos transversales que se encuentran comúnmente en estadísticas, resultados de ciencias experimentales, econometría o finanzas. Pandas es una de las principales bibliotecas de ciencia de datos en Python.

4
¿Cuál es la diferencia entre pandas.qcut y pandas.cut?
La documentación dice: http://pandas.pydata.org/pandas-docs/dev/basics.html "Los valores continuos se pueden discretizar utilizando las funciones cut (bins basados ​​en valores) y qcut (bins basados ​​en cuantiles de muestra)" Suena muy abstracto para mí ... Puedo ver las diferencias en el siguiente ejemplo, pero ¿qué significa realmente qcut (cuantil de muestra)? ¿Cuándo usarías …
94 python  pandas 


11
Encuentre el índice entero de filas con NaN en el marco de datos de pandas
Tengo un DataFrame de pandas como este: a b 2011-01-01 00:00:00 1.883381 -0.416629 2011-01-01 01:00:00 0.149948 -1.782170 2011-01-01 02:00:00 -0.407604 0.314168 2011-01-01 03:00:00 1.452354 NaN 2011-01-01 04:00:00 -1.224869 -0.947457 2011-01-01 05:00:00 0.498326 0.070416 2011-01-01 06:00:00 0.401665 NaN 2011-01-01 07:00:00 -0.019766 0.533641 2011-01-01 08:00:00 -1.101303 -1.408561 2011-01-01 09:00:00 1.671795 -0.764629 ¿Existe …
94 python  pandas 

5
¿Cuál es la diferencia entre NaN y None?
Estoy leyendo dos columnas de un archivo csv usando pandas readcsv()y luego asignando los valores a un diccionario. Las columnas contienen cadenas de números y letras. Ocasionalmente, hay casos en los que una celda está vacía. En mi opinión, el valor leído en esa entrada del diccionario debería ser Nonepero …
94 python  numpy  pandas  nan 



3
Recuento agregado de pandas distinto
Digamos que tengo un registro de la actividad de los usuarios y quiero generar un informe de la duración total y el número de usuarios únicos por día. import numpy as np import pandas as pd df = pd.DataFrame({'date': ['2013-04-01','2013-04-01','2013-04-01','2013-04-02', '2013-04-02'], 'user_id': ['0001', '0001', '0002', '0002', '0002'], 'duration': [30, 15, …
94 python  pandas 

10
Eliminar varias columnas según los nombres de las columnas en Pandas
Tengo algunos datos y cuando los importo obtengo las siguientes columnas innecesarias Estoy buscando una manera fácil de eliminar todos estos 'Unnamed: 24', 'Unnamed: 25', 'Unnamed: 26', 'Unnamed: 27', 'Unnamed: 28', 'Unnamed: 29', 'Unnamed: 30', 'Unnamed: 31', 'Unnamed: 32', 'Unnamed: 33', 'Unnamed: 34', 'Unnamed: 35', 'Unnamed: 36', 'Unnamed: 37', 'Unnamed: …
94 python  pandas 


5
Trazar datos categóricos con pandas y matplotlib
Tengo un marco de datos con datos categóricos: colour direction 1 red up 2 blue up 3 green down 4 red left 5 red right 6 yellow down 7 blue down Quiero generar algunos gráficos, como gráficos circulares e histogramas basados ​​en las categorías. ¿Es posible sin crear variables numéricas …
94 python  pandas 

7
Pandas Cómo filtrar una serie
Tengo una serie como esta después de hacer groupby ('nombre') y usar la función mean () en otra columna name 383 3.000000 663 1.000000 726 1.000000 737 9.000000 833 8.166667 ¿Alguien podría mostrarme cómo filtrar las filas con valores medios de 1.000000? Gracias y agradezco mucho su ayuda.
94 python  pandas 

6
¿Hay alguna forma en Pandas de usar el valor de fila anterior en dataframe.apply cuando el valor anterior también se calcula en la aplicación?
Tengo el siguiente marco de datos: Index_Date A B C D =============================== 2015-01-31 10 10 Nan 10 2015-02-01 2 3 Nan 22 2015-02-02 10 60 Nan 280 2015-02-03 10 100 Nan 250 Exigir: Index_Date A B C D =============================== 2015-01-31 10 10 10 10 2015-02-01 2 3 23 22 2015-02-02 …




Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.