Programación dataframe

6

Mostrar todas las columnas de marcos de datos en un cuaderno Jupyter Python

Quiero mostrar todas las columnas en un marco de datos en un Jupyter Notebook. Jupyter muestra algunas de las columnas y agrega puntos a las últimas columnas como en la siguiente imagen: ¿Cómo puedo mostrar todas las columnas?

103 python python-3.x dataframe jupyter-notebook

6

¿Cómo leer un archivo .xlsx usando la biblioteca pandas en iPython?

Quiero leer un archivo .xlsx usando la biblioteca Pandas de python y transferir los datos a una tabla postgreSQL. Todo lo que pude hacer hasta ahora es: import pandas as pd data = pd.ExcelFile("*File Name*") Ahora sé que el paso se ejecutó con éxito, pero quiero saber cómo puedo analizar …

102 python pandas ipython ipython-notebook dataframe

8

Limpiar los valores `Inf` de un marco de datos R

En R, tengo una operación que crea algunos Infvalores cuando transformo un marco de datos. Me gustaría convertir estos Infvalores en NAvalores. El código que tengo es lento para datos grandes, ¿hay alguna forma más rápida de hacer esto? Digamos que tengo el siguiente marco de datos: dat <- data.frame(a=c(1, …

101 r dataframe data.table

2

El objeto 'DataFrame' no tiene atributo 'sort'

Me enfrento a un problema aquí, en mi paquete de python he instalado numpy, pero todavía tengo este error El objeto 'DataFrame' no tiene atributo 'sort' Cualquiera puede darme una idea ... Este es mi codigo: final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final = final.sort() …

101 python pandas numpy dataframe

7

Cómo cambiar una columna en Pandas DataFrame

Me gustaría cambiar una columna en un Pandas DataFrame, pero no he podido encontrar un método para hacerlo desde la documentación sin volver a escribir todo el DF. Alguien sabe como hacerlo? Marco de datos: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 …

101 python pandas dataframe

2

Encuentra el máximo de dos o más columnas con pandas

Tengo una trama de datos con columnas A, B. Necesito crear una columna de Cmodo que para cada registro / fila: C = max(A, B). ¿Cómo debo hacer esto?

101 python dataframe pandas

1

Manera de leer las primeras líneas para el marco de datos de pandas

¿Existe una forma incorporada de usar read_csvpara leer solo las primeras nlíneas de un archivo sin saber la longitud de las líneas de antemano? Tengo un archivo grande que tarda mucho en leerse, y ocasionalmente solo quiero usar las primeras, digamos, 20 líneas para obtener una muestra (y prefiero no …

100 python pandas csv dataframe

10

Filtrar la columna de marco de datos de Pyspark con valor Ninguno

Estoy tratando de filtrar un marco de datos PySpark que tiene Nonecomo valor de fila: df.select('dt_mvmt').distinct().collect() [Row(dt_mvmt=u'2016-03-27'), Row(dt_mvmt=u'2016-03-28'), Row(dt_mvmt=u'2016-03-29'), Row(dt_mvmt=None), Row(dt_mvmt=u'2016-03-30'), Row(dt_mvmt=u'2016-03-31')] y puedo filtrar correctamente con un valor de cadena: df[df.dt_mvmt == '2016-03-31'] # some results here pero esto falla: df[df.dt_mvmt == None].count() 0 df[df.dt_mvmt != None].count() 0 Pero …

100 python apache-spark dataframe pyspark apache-spark-sql

2

Columna de agrupamiento con pandas pitón

Tengo una columna de marco de datos con valores numéricos: df['percentage'].head() 46.5 44.2 100.0 42.12 Quiero ver la columna como bin cuenta: bins = [0, 1, 5, 10, 25, 50, 100] ¿Cómo puedo obtener el resultado como contenedores con ellos value counts? [0, 1] bin amount [1, 5] etc [5, …

99 python pandas numpy dataframe binning

5

cómo cambiar una columna de marco de datos de tipo de cadena a tipo doble en pyspark

Tengo un marco de datos con una columna como Cadena. Quería cambiar el tipo de columna a tipo doble en PySpark. A continuación se muestra la forma que hice: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show'])) Solo quería saber si esta es la manera correcta de hacerlo, ya que …

99 python apache-spark dataframe pyspark apache-spark-sql

5

Reemplace None con NaN en pandas dataframe

Tengo mesa x: website 0 http://www.google.com/ 1 http://www.yahoo.com 2 None Quiero reemplazar Python None con pandas NaN. Lo intenté: x.replace(to_replace=None, value=np.nan) Pero tengo: TypeError: 'regex' must be a string or a compiled regular expression or a list or dict of strings or regular expressions, you passed a 'bool' ¿Cómo debo …

99 pandas dataframe replace nan nonetype

6

Convierta el marco de datos de pandas en series

Soy algo nuevo en pandas. Tengo un marco de datos de pandas de 1 fila por 23 columnas. ¿Quiero convertir esto en una serie? Me pregunto cuál es la forma más pitónica de hacer esto. Lo he intentado pd.Series(myResults)pero se queja ValueError: cannot copy sequence with size 23 to array …

98 python pandas dataframe series

10

Python Pandas: encuentra la diferencia entre dos marcos de datos

Tengo dos marcos de datos df1 y df2, donde df2 es un subconjunto de df1. ¿Cómo obtengo un nuevo marco de datos (df3) que es la diferencia entre los dos marcos de datos? En otras palabras, ¿un marco de datos que tiene todas las filas / columnas en df1 que …

98 python pandas dataframe

7

Los pandas que seleccionan por etiqueta a veces devuelven Series, a veces devuelven DataFrame

En Pandas, cuando selecciono una etiqueta que solo tiene una entrada en el índice, obtengo una Serie, pero cuando selecciono una entrada que tiene más de una entrada, obtengo un marco de datos. ¿Porqué es eso? ¿Hay alguna forma de asegurar que siempre recupere un marco de datos? In [1]: …

97 python pandas dataframe slice series

3

Python Pandas reemplaza NaN en una columna con el valor de la fila correspondiente de la segunda columna

Estoy trabajando con este Pandas DataFrame en Python. File heat Farheit Temp_Rating 1 YesQ 75 N/A 1 NoR 115 N/A 1 YesA 63 N/A 1 NoT 83 41 1 NoY 100 80 1 YesZ 56 12 2 YesQ 111 N/A 2 NoR 60 N/A 2 YesA 19 N/A 2 NoT …

97 python pandas dataframe nan fillna

Preguntas etiquetadas con dataframe