No hay ninguna razón para ver la salida completa de un gran marco de datos. Ver o manipular grandes marcos de datos utilizará innecesariamente grandes cantidades de los recursos de su computadora.
Lo que sea que esté haciendo se puede hacer en miniatura. Es mucho más fácil trabajar en la codificación y manipulación de datos cuando el marco de datos es pequeño. La mejor manera de trabajar con big data es crear un nuevo marco de datos que tome solo una pequeña porción o una pequeña muestra del gran marco de datos. Luego puede explorar los datos y codificar en el marco de datos más pequeño. Una vez que haya explorado los datos y haga funcionar su código, simplemente use ese código en el marco de datos más grande.
La forma más fácil es simplemente tomar el primer n, número de las primeras filas del marco de datos utilizando la función head (). La función head solo imprime n, número de filas. Puede crear un mini marco de datos utilizando la función de cabeza en el marco de datos grande. A continuación, elegí seleccionar las primeras 50 filas y pasar su valor a small_df. Esto supone que BigData es un archivo de datos que proviene de una biblioteca que abrió para este proyecto.
library(namedPackage)
df <- data.frame(BigData) # Assign big data to df
small_df <- head(df, 50) # Assign the first 50 rows to small_df
Esto funcionará la mayor parte del tiempo, pero a veces el marco de datos grandes viene con variables preseleccionadas o con variables ya agrupadas. Si los datos grandes son así, necesitaría tomar una muestra aleatoria de las filas de los datos grandes. Luego use el código que sigue:
df <- data.frame(BigData)
set.seed(1016) # set your own seed
df_small <- df[sample(nrow(df),replace=F,size=.03*nrow(df)),] # samples 3% rows
df_small # much smaller df