Tengo un marco de datos y una lista de columnas en ese marco de datos que me gustaría eliminar. Usemos el iris
conjunto de datos como ejemplo. Me gustaría dejar caer Sepal.Length
y Sepal.Width
y utilizar sólo las columnas restantes. ¿Cómo puedo hacer esto usando select
o select_
desde el dplyr
paquete?
Esto es lo que he probado hasta ahora:
drop.cols <- c('Sepal.Length', 'Sepal.Width')
iris %>% select(-drop.cols)
Error en -drop.cols: argumento no válido para el operador unario
iris %>% select_(.dots = -drop.cols)
Error en -drop.cols: argumento no válido para el operador unario
iris %>% select(!drop.cols)
Error en! Drop.cols: tipo de argumento no válido
iris %>% select_(.dots = !drop.cols)
Error en! Drop.cols: tipo de argumento no válido
Siento que me estoy perdiendo algo obvio porque parece una operación bastante útil que ya debería existir. En Github, alguien publicó un problema similar , y Hadley dijo que usara 'indexación negativa'. Eso es lo que (creo) he intentado, pero fue en vano. ¿Alguna sugerencia?
iris
, pero no en mi marco de datos real (iris
fue un ejemplo de juguete). Mi marco de datos contiene 4558 filas y 147 columnas. El mensaje de error que recibí fueError in eval(x$expr, data, x$env) : variable names are limited to 10000 bytes
. ¿Alguna idea de por qué esto podría estar sucediendo?