Preguntas etiquetadas con pandas

Pandas es una biblioteca de Python para la manipulación y el análisis de datos, por ejemplo, marcos de datos, series de tiempo multidimensionales y conjuntos de datos transversales que se encuentran comúnmente en estadísticas, resultados de ciencias experimentales, econometría o finanzas. Pandas es una de las principales bibliotecas de ciencia de datos en Python.



7
¿Cuál es la diferencia entre unirse y fusionarse en Pandas?
Supongamos que tengo dos DataFrames así: left = pd.DataFrame({'key1': ['foo', 'bar'], 'lval': [1, 2]}) right = pd.DataFrame({'key2': ['foo', 'bar'], 'rval': [4, 5]}) Quiero fusionarlos, así que intento algo como esto: pd.merge(left, right, left_on='key1', right_on='key2') Y estoy feliz key1 lval key2 rval 0 foo 1 foo 4 1 bar 2 bar …
208 python  pandas  dataframe  join 

7
Pandas group-by y sum
Estoy usando este marco de datos: Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 …

9
Mantenga solo la parte de fecha cuando use pandas.to_datetime
Utilizo pandas.to_datetimepara analizar las fechas en mis datos. Pandas por defecto representa las fechas con datetime64[ns]aunque las fechas son todas diarias. Me pregunto si hay una forma elegante / inteligente de convertir las fechas datetime.dateo datetime64[D]para que, cuando escribo los datos en CSV, no se agreguen las fechas 00:00:00. Sé …
201 python  pandas  csv  datetime  series 



7
Agregue etiquetas x e y a un diagrama de pandas
Supongamos que tengo el siguiente código que traza algo muy simple usando pandas: import pandas as pd values = [[1, 2], [2, 5]] df2 = pd.DataFrame(values, columns=['Type A', 'Type B'], index=['Index 1', 'Index 2']) df2.plot(lw=2, colormap='jet', marker='.', markersize=10, title='Video streaming dropout by category') ¿Cómo configuro fácilmente las etiquetas x e …

11
¿Cómo dividir una columna en dos columnas?
Tengo un marco de datos con una columna y me gustaría dividirlo en dos columnas, con un encabezado de columna como ' fips'y el otro'row' Mi dataframe se dfve así: row 0 00000 UNITED STATES 1 01000 ALABAMA 2 01001 Autauga County, AL 3 01003 Baldwin County, AL 4 01005 …
196 python  dataframe  pandas 

8
Seleccione filas de DataFrame entre dos fechas
Estoy creando un DataFrame desde un csv de la siguiente manera: stock = pd.read_csv('data_in/' + filename + '.csv', skipinitialspace=True) El DataFrame tiene una columna de fecha. ¿Hay alguna manera de crear un nuevo DataFrame (o simplemente sobrescribir el existente) que solo contiene filas con valores de fecha que se encuentran …
196 python  pandas 



15
¿Cómo leo un archivo csv grande con pandas?
Estoy tratando de leer un archivo csv grande (aprox. 6 GB) en pandas y recibo un error de memoria: MemoryError Traceback (most recent call last) <ipython-input-58-67a72687871b> in <module>() ----> 1 data=pd.read_csv('aphro.csv',sep=';') ... MemoryError: ¿Alguna ayuda en esto?
194 python  pandas  csv  memory  chunks 



Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.