Preguntas etiquetadas con pandas

Pandas es una biblioteca de Python para la manipulación y el análisis de datos, por ejemplo, marcos de datos, series de tiempo multidimensionales y conjuntos de datos transversales que se encuentran comúnmente en estadísticas, resultados de ciencias experimentales, econometría o finanzas. Pandas es una de las principales bibliotecas de ciencia de datos en Python.

4
Aplicar vs transformar en un objeto de grupo
Considere el siguiente marco de datos: A B C D 0 foo one 0.162003 0.087469 1 bar one -1.156319 -1.526272 2 foo two 0.833892 -1.666304 3 bar three -2.026673 -0.322057 4 foo two 0.411452 -0.954371 5 bar two 0.765878 -0.095968 6 foo one -0.654890 0.678091 7 foo three -1.789842 -1.130922 …
174 python  pandas 

5
pandas loc vs. iloc vs. ix vs. at vs. iat?
Recientemente comencé a bifurcarme desde mi lugar seguro (R) en Python y estoy un poco confundido por la localización / selección celular en Pandas. He leído la documentación pero me cuesta entender las implicaciones prácticas de las diversas opciones de localización / selección. ¿Hay alguna razón por la que debe …

10
Cómo guardar una trama de Seaborn en un archivo
Intenté el siguiente código ( test_seaborn.py): import matplotlib matplotlib.use('Agg') import matplotlib.pyplot as plt matplotlib.style.use('ggplot') import seaborn as sns sns.set() df = sns.load_dataset('iris') sns_plot = sns.pairplot(df, hue='species', size=2.5) fig = sns_plot.get_figure() fig.savefig("output.png") #sns.plt.show() Pero me sale este error: Traceback (most recent call last): File "test_searborn.py", line 11, in <module> fig = …

8
Cómo imprimir pandas DataFrame sin índice
Quiero imprimir todo el marco de datos, pero no quiero imprimir el índice Además, una columna es el tipo de fecha y hora, solo quiero imprimir la hora, no la fecha. El marco de datos se ve así: User ID Enter Time Activity Number 0 123 2014-07-08 00:09:00 1411 1 …

7
Cómo filtrar filas en pandas por regex
Me gustaría filtrar limpiamente un marco de datos usando expresiones regulares en una de las columnas. Para un ejemplo artificial: In [210]: foo = pd.DataFrame({'a' : [1,2,3,4], 'b' : ['hi', 'foo', 'fat', 'cat']}) In [211]: foo Out[211]: a b 0 1 hi 1 2 foo 2 3 fat 3 4 …
169 python  regex  pandas 

3
pandas: fusionar (unir) dos marcos de datos en varias columnas
Estoy tratando de unir dos marcos de datos de pandas usando dos columnas: new_df = pd.merge(A_df, B_df, how='left', left_on='[A_c1,c2]', right_on = '[B_c1,c2]') pero recibí el siguiente error: pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4164)() pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4028)() pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13166)() pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13120)() KeyError: '[B_1, c2]' ¿Alguna idea de cuál …




5
pandas groupby sort into groups
Quiero agrupar mi marco de datos por dos columnas y luego ordenar los resultados agregados dentro de los grupos. In [167]: df Out[167]: count job source 0 2 sales A 1 4 sales B 2 6 sales C 3 3 sales D 4 7 sales E 5 5 market A …

6
Pandas DataFrame Group por dos columnas y obtener recuentos
Tengo un marco de datos de pandas en el siguiente formato: df = pd.DataFrame([[1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], list('AAABBBBABCBDDD'), [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], ['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'],['1','3','3','2','4','2','5','3','6','3','5','1','1','1']]).T df.columns = ['col1','col2','col3','col4','col5'] df: col1 col2 col3 col4 col5 0 1.1 A 1.1 x/y/z 1 1 1.1 A 1.7 x/y 3 2 1.1 …
166 python  pandas  dataframe 

4
Cómo agregar una fila de encabezado a un DataFrame de pandas
Estoy leyendo un archivo csv en pandas. Este archivo csv consta de cuatro columnas y algunas filas, pero no tiene una fila de encabezado, que quiero agregar. He estado intentando lo siguiente: Cov = pd.read_csv("path/to/file.txt", sep='\t') Frame=pd.DataFrame([Cov], columns = ["Sequence", "Start", "End", "Coverage"]) Frame.to_csv("path/to/file.txt", sep='\t') Pero cuando aplico el código, …
166 python  csv  pandas  header 

7
¿Cómo mostrar pandas DataFrame de flotadores usando una cadena de formato para columnas?
Me gustaría mostrar un marco de datos de pandas con un formato determinado usando print()y el IPython display(). Por ejemplo: df = pd.DataFrame([123.4567, 234.5678, 345.6789, 456.7890], index=['foo','bar','baz','quux'], columns=['cost']) print df cost foo 123.4567 bar 234.5678 baz 345.6789 quux 456.7890 Me gustaría de alguna manera obligar a esto a imprimir cost …

4
Pandas DataFrame a la lista de diccionarios
Tengo el siguiente DataFrame: cliente item1 item2 item3 1 tomate de leche de manzana 2 papas de naranja con agua 3 chips de jugo de mango que quiero traducir a la lista de diccionarios por fila rows = [{'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'}, {'customer': 2, 'item1': 'water', …


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.