Preguntas etiquetadas con dataframe

Un marco de datos es una estructura de datos tabular. Por lo general, contiene datos donde las filas son observaciones y las columnas son variables de varios tipos. Mientras "marco de datos" o "marco de datos" es el término utilizado para este concepto en varios idiomas (R, Apache Spark, deedle, Maple, la biblioteca de pandas en Python y la biblioteca de marcos de datos en Julia), "tabla" es el término utilizado en MATLAB y SQL.



8
Limpiar los valores `Inf` de un marco de datos R
En R, tengo una operación que crea algunos Infvalores cuando transformo un marco de datos. Me gustaría convertir estos Infvalores en NAvalores. El código que tengo es lento para datos grandes, ¿hay alguna forma más rápida de hacer esto? Digamos que tengo el siguiente marco de datos: dat <- data.frame(a=c(1, …
101 r  dataframe  data.table 

2
El objeto 'DataFrame' no tiene atributo 'sort'
Me enfrento a un problema aquí, en mi paquete de python he instalado numpy, pero todavía tengo este error El objeto 'DataFrame' no tiene atributo 'sort' Cualquiera puede darme una idea ... Este es mi codigo: final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final = final.sort() …

7
Cómo cambiar una columna en Pandas DataFrame
Me gustaría cambiar una columna en un Pandas DataFrame, pero no he podido encontrar un método para hacerlo desde la documentación sin volver a escribir todo el DF. Alguien sabe como hacerlo? Marco de datos: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 …
101 python  pandas  dataframe 



10
Filtrar la columna de marco de datos de Pyspark con valor Ninguno
Estoy tratando de filtrar un marco de datos PySpark que tiene Nonecomo valor de fila: df.select('dt_mvmt').distinct().collect() [Row(dt_mvmt=u'2016-03-27'), Row(dt_mvmt=u'2016-03-28'), Row(dt_mvmt=u'2016-03-29'), Row(dt_mvmt=None), Row(dt_mvmt=u'2016-03-30'), Row(dt_mvmt=u'2016-03-31')] y puedo filtrar correctamente con un valor de cadena: df[df.dt_mvmt == '2016-03-31'] # some results here pero esto falla: df[df.dt_mvmt == None].count() 0 df[df.dt_mvmt != None].count() 0 Pero …

2
Columna de agrupamiento con pandas pitón
Tengo una columna de marco de datos con valores numéricos: df['percentage'].head() 46.5 44.2 100.0 42.12 Quiero ver la columna como bin cuenta: bins = [0, 1, 5, 10, 25, 50, 100] ¿Cómo puedo obtener el resultado como contenedores con ellos value counts? [0, 1] bin amount [1, 5] etc [5, …

5
cómo cambiar una columna de marco de datos de tipo de cadena a tipo doble en pyspark
Tengo un marco de datos con una columna como Cadena. Quería cambiar el tipo de columna a tipo doble en PySpark. A continuación se muestra la forma que hice: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show'])) Solo quería saber si esta es la manera correcta de hacerlo, ya que …

5
Reemplace None con NaN en pandas dataframe
Tengo mesa x: website 0 http://www.google.com/ 1 http://www.yahoo.com 2 None Quiero reemplazar Python None con pandas NaN. Lo intenté: x.replace(to_replace=None, value=np.nan) Pero tengo: TypeError: 'regex' must be a string or a compiled regular expression or a list or dict of strings or regular expressions, you passed a 'bool' ¿Cómo debo …

6
Convierta el marco de datos de pandas en series
Soy algo nuevo en pandas. Tengo un marco de datos de pandas de 1 fila por 23 columnas. ¿Quiero convertir esto en una serie? Me pregunto cuál es la forma más pitónica de hacer esto. Lo he intentado pd.Series(myResults)pero se queja ValueError: cannot copy sequence with size 23 to array …




Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.