Preguntas etiquetadas con dataframe

Un marco de datos es una estructura de datos tabular. Por lo general, contiene datos donde las filas son observaciones y las columnas son variables de varios tipos. Mientras "marco de datos" o "marco de datos" es el término utilizado para este concepto en varios idiomas (R, Apache Spark, deedle, Maple, la biblioteca de pandas en Python y la biblioteca de marcos de datos en Julia), "tabla" es el término utilizado en MATLAB y SQL.

1
Cómo pivotar el marco de datos que consiste en una columna con una sección y una subsección en R
Tengo un marco de datos mencionado a continuación: structure( list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7", "P-8"), Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04", "2020-03-16 06:13:55", "2020-03-16 10:03:43", "2020-03-16 12:37:09", "2020-03-16 06:40:24", "2020-03-16 09:46:45", "2020-03-16 12:07:44", "2020-03-16 14:09:51", "2020-03-16 09:19:23"), Status = c("SA", "SA", "SA", "RE", …

2
Generar productos cartesianos binarios filtrados.
Planteamiento del problema Estoy buscando una forma eficiente de generar productos cartesianos binarios completos (tablas con todas las combinaciones de Verdadero y Falso con un cierto número de columnas), filtradas por ciertas condiciones exclusivas. Por ejemplo, para tres columnas / bits n=3obtendríamos la tabla completa df_combs = pd.DataFrame(itertools.product(*([[True, False]] * …



6
Identificar y marcar filas duplicadas en r
Me gustaría identificar y marcar filas duplicadas basadas en 2 columnas. Me gustaría hacer un identificador único para cada duplicado, así que sé no solo que la fila es un duplicado, sino con qué fila es un duplicado. Tengo un marco de datos que se ve a continuación con algunos …
11 r  dataframe 


6
fusionar marcos de datos basados ​​en múltiples columnas y umbrales
Tengo dos data.frames con múltiples columnas comunes (en este caso date, city, ctry, y ( other_) number). Ahora me gustaría fusionarlos en las columnas anteriores, pero tolero algún nivel de diferencia: threshold.numbers <- 3 threshold.date <- 5 # in days Si la diferencia entre las dateentradas es > threshold.date(en días) …
11 r  dataframe 



3
Liberar solo parte de una columna del marco de datos de pandas
Tengo el siguiente marco de datos de ejemplo: df = pd.DataFrame(data = {'RecordID' : [1,1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,5,5,5,5], 'DisplayLabel' : ['Source','Test','Value 1','Value 2','Value3','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2'], 'Value' : ['Web','Logic','S','I','Complete','Person','Voice','>20','P','Mail','OCR','A','I','Dictation','Understandable','S','I','Web','Logic','R','S']}) que crea este marco de datos: +-------+----------+---------------+----------------+ | Index | RecordID | Display Label | Value | +-------+----------+---------------+----------------+ | …



1
fusionar dos marcos de datos y agregar nivel de columna con nombres
Hola, he estado investigando los métodos de concat, join y fusion para pandas y parece que no puedo encontrar lo que quiero. Supongamos que tengo dos marcos de datos A = pd.DataFrame("A",index=[0,1,2,3,4],columns=['Col 1','Col 2','Col 3']) B = pd.DataFrame("B",index=[0,1,2,3,4],columns=['Col 1','Col 2','Col 3']) >>> A Col 1 Col 2 Col 3 0 …



Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.