Tengo un conjunto de datos ASCII que consta de tres columnas, pero solo las dos últimas son datos reales. Ahora quiero crear un diagrama de puntos de los datos usando read.csv(file = "result1", sep= " "). R lee las tres columnas. ¿Cómo evito esto?
Tengo un conjunto de datos ASCII que consta de tres columnas, pero solo las dos últimas son datos reales. Ahora quiero crear un diagrama de puntos de los datos usando read.csv(file = "result1", sep= " "). R lee las tres columnas. ¿Cómo evito esto?
Respuestas:
Puede usar el colClassesargumento read.csvpara seleccionar las columnas que desee. En este caso, se puede establecer colClassesac("NULL", NA, NA)
read.csv(file="result1", sep=" ", colClasses=c("NULL", NA, NA))
De manera más general, puede usar colClasses para especificar los tipos particulares de columnas; NAsignifica utilizar el enfoque predeterminado que consiste en tratar de descubrir cuál es la columna automáticamente. Vea la página de ayuda read.csvpara más detalles.
Otra opción es leer todo el archivo, pero mantener solo dos de las columnas, por ejemplo:
read.csv(file = "result1", sep = " ")[ ,1:2]
o, usando nombres de columna, por ejemplo. si las columnas se llaman 'col1, col2, col3'
read.csv(file = "result1", sep = " ")[ ,c('col1', 'col2')]
Este lleva menos tiempo en comparación con las respuestas proporcionadas
library(data.table)
fread(file="result1", sep=" ", colClasses=c("NULL", NA, NA))