Preguntas etiquetadas con data.table

El paquete R data.table es una extensión de data.frame creada para un rápido análisis de datos en memoria. Utilice la etiqueta dt para el paquete DataTables con Shiny (DT).

8
Convertir clases de columna en data.table
Tengo un problema al usar data.table: ¿Cómo convierto clases de columna? Aquí hay un ejemplo simple: con data.frame no tengo problemas para convertirlo, con data.table simplemente no sé cómo: df <- data.frame(ID=c(rep("A", 5), rep("B",5)), Quarter=c(1:5, 1:5), value=rnorm(10)) #One way: http://stackoverflow.com/questions/2851015/r-convert-data-frame-columns-from-factors-to-characters df <- data.frame(lapply(df, as.character), stringsAsFactors=FALSE) #Another way df[, "value"] <- …
118 r  data.table 

2
¿Cuál es el propósito de establecer una clave en data.table?
Estoy usando data.table y hay muchas funciones que requieren que establezca una clave (por ejemplo X[Y]). Como tal, deseo comprender qué hace una clave para configurar correctamente las claves en mis tablas de datos. Una fuente que leí fue ?setkey. setkey()ordena un data.tabley lo marca como ordenado. Las columnas ordenadas …
113 r  data.table 

8
Limpiar los valores `Inf` de un marco de datos R
En R, tengo una operación que crea algunos Infvalores cuando transformo un marco de datos. Me gustaría convertir estos Infvalores en NAvalores. El código que tengo es lento para datos grandes, ¿hay alguna forma más rápida de hacer esto? Digamos que tengo el siguiente marco de datos: dat <- data.frame(a=c(1, …
101 r  dataframe  data.table 


6
Obteniendo los mejores valores por grupo
Aquí hay un marco de datos de muestra: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Quiero que el subconjunto dcontenga las filas con los 5 valores superiores de xpara cada valor de grp. Usando base-R, mi enfoque sería algo como: ordered <- d[order(d$x, decreasing = TRUE), …
93 r  data.table  dplyr 


4
dplyr en data.table, ¿realmente estoy usando data.table?
Si uso la sintaxis de dplyr sobre una tabla de datos , ¿obtengo todos los beneficios de velocidad de la tabla de datos mientras sigo usando la sintaxis de dplyr? En otras palabras, ¿uso incorrectamente la tabla de datos si la consulto con la sintaxis dplyr? ¿O necesito usar una …
91 r  data.table  dplyr 


5
Dividir la cadena de texto en columnas de una tabla de datos
Tengo una secuencia de comandos que lee datos de un archivo CSV en data.tableay luego divide el texto en una columna en varias columnas nuevas. Actualmente estoy usando las funciones lapplyy strsplitpara hacer esto. He aquí un ejemplo: library("data.table") df = data.table(PREFIX = c("A_B","A_C","A_D","B_A","B_C","B_D"), VALUE = 1:6) dt = as.data.table(df) …
86 r  data.table 






5
data.table interpolando linealmente valores de NA sin grupos
Quería completar algunos valores de NA en una tabla de datos sin grupos. Considere este extracto de data.table que representa el tiempo y las distancias: library(data.table) df <- data.frame(time = seq(7173, 7195, 1), dist = c(31091.33, NA, 31100.00, 31103.27, NA, NA, NA, NA, 31124.98, NA,31132.81, NA, NA, NA, NA, 31154.19, …
18 r  data.table 

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.