Preguntas etiquetadas con dplyr

Utilice esta etiqueta para preguntas relacionadas con funciones del paquete dplyr, como group_by, summary, filter y select.


5
Mostrar / imprimir todas las filas de un tibble (tbl_df)
tibble(anteriormente tbl_df) es una versión de una trama de datos creada por el dplyrpaquete de manipulación de trama de datos en R. Evita salidas de tabla largas cuando se llama accidentalmente a la trama de datos. Una vez que un marco de datos ha sido envuelto por tibble/ tbl_df, ¿hay …
192 r  dplyr  options  display 

4
Filtrar filas que contienen una cadena determinada
Tengo que filtrar un marco de datos utilizando como criterio aquellas filas en las que está contenida la cadena RTB. Estoy usando dplyr. d.del <- df %>% group_by(TrackingPixel) %>% summarise(MonthDelivery = as.integer(sum(Revenue))) %>% arrange(desc(MonthDelivery)) Sé que puedo utilizar la función filterde dplyrpero no exactamente cómo contarla para comprobar el contenido …
188 r  filter  dplyr 


7
Extraer una columna dplyr tbl como vector
¿Hay una manera más sucinta de obtener una columna de un dplyr tbl como vector, a partir de un tbl con el back-end de la base de datos (es decir, el marco / tabla de datos no puede ser subconjunto directamente)? require(dplyr) db <- src_sqlite(tempfile(), create = TRUE) iris2 <- …

8
Arreglando una "columna desconocida" de advertencia múltiple
Tengo una advertencia múltiple persistente de "columna desconocida" para todos los tipos de comandos (por ejemplo, str (x) para instalar actualizaciones en paquetes), y no estoy seguro de cómo depurar esto o solucionarlo. La "columna desconocida" de advertencia está claramente relacionada con una variable en un tbl_df que renombré, pero …
171 r  dplyr 

9
Utilice nombres de variables dinámicas en `dplyr`
Quiero usar dplyr::mutate()para crear múltiples columnas nuevas en un marco de datos. Los nombres de columna y sus contenidos deben generarse dinámicamente. Datos de ejemplo de iris: library(dplyr) iris <- tbl_df(iris) He creado una función para mutar mis nuevas columnas de la Petal.Widthvariable: multipetal <- function(df, n) { varname <- …
168 r  dplyr  r-faq 

9
Agrupe por varias columnas en dplyr, usando la entrada de vector de cadena
Estoy tratando de transferir mi comprensión de plyr a dplyr, pero no puedo entender cómo agrupar por múltiples columnas. # make data with weird column names that can't be hard coded data = data.frame( asihckhdoydkhxiydfgfTgdsx = sample(LETTERS[1:3], 100, replace=TRUE), a30mvxigxkghc5cdsvxvyv0ja = sample(LETTERS[1:3], 100, replace=TRUE), value = rnorm(100) ) # get …
157 r  dplyr  r-faq 

7
Frecuencias / proporciones relativas con dplyr
Supongamos que quiero calcular la proporción de diferentes valores dentro de cada grupo. Por ejemplo, usando los mtcarsdatos, ¿cómo calculo la frecuencia relativa del número de engranajes por am (automático / manual) de una vez dplyr? library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) # count frequency mtcars %>% group_by(am, gear) %>% summarise(n …
153 r  group-by  dplyr  frequency 

9
Seleccione la primera y la última fila de los datos agrupados
Pregunta Utilizando dplyr, ¿cómo selecciono las observaciones / filas superiores e inferiores de datos agrupados en una declaración? Datos y ejemplo Dado un marco de datos df <- data.frame(id=c(1,1,1,2,2,2,3,3,3), stopId=c("a","b","c","a","b","c","a","b","c"), stopSequence=c(1,2,3,3,1,4,3,1,2)) Puedo obtener las observaciones superior e inferior de cada grupo usando slice, pero usando dos declaraciones separadas: firstStop <- …
137 r  dplyr 

6
Eliminar filas duplicadas con dplyr
Tengo un data.frame como este: set.seed(123) df = data.frame(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),z=1:10) > df x y z 1 0 1 1 2 1 0 2 3 0 1 3 4 1 1 4 5 1 0 5 6 0 1 6 7 1 0 7 8 1 0 8 9 1 0 9 …
128 r  dplyr 

6
¿Aplicando una función a cada fila de una tabla usando dplyr?
Cuando trabajaba, a plyrmenudo me resultaba útil usar adplypara funciones escalares que tenía que aplicar a todas y cada una de las filas. p.ej data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Max.Len 1 5.1 3.5 1.4 0.2 setosa 5.1 2 4.9 3.0 …
121 r  plyr  dplyr 


6
Reemplazo de "renombrar" en dplyr
Me gusta la función de cambio de nombre de plyr rename. Recientemente comencé a usar dplyr y me preguntaba si hay una manera fácil de cambiar el nombre de las variables usando una función de dplyr, que sea tan fácil de usar como la de plyr rename.
118 r  rename  dplyr 

1
¿Puede dplyr unirse en varias columnas o clave compuesta?
Me doy cuenta de que la dplyrv3.0 te permite unirte a diferentes variables: left_join(x, y, by = c("a" = "b")coincidirá x.acony.b Sin embargo, ¿es posible unir una combinación de variables o tengo que agregar una clave compuesta de antemano? Algo como esto: left_join(x, y, by = c("a c" = "b …
111 r  dplyr 

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.