Para una solución que está libre de dependencias externas complicadas *, ahora hay readxl
:
El paquete readxl facilita la extracción de datos de Excel y los lleva a R. En comparación con muchos de los paquetes existentes (por ejemplo, gdata, xlsx, xlsReadWrite), readxl no tiene dependencias externas, por lo que es fácil de instalar y usar en todos los sistemas operativos. Está diseñado para trabajar con datos tabulares almacenados en una sola hoja.
Readxl admite tanto el formato .xls heredado como el formato .xlsx moderno basado en xml. El soporte .xls es posible con la biblioteca libxls C, que abstrae muchas de las complejidades del formato binario subyacente. Para analizar .xlsx, usamos la biblioteca RapidXML C ++.
Se puede instalar así:
install.packages("readxl")
o
devtools::install_github("hadley/readxl")
Uso
library(readxl)
read_excel("my-old-spreadsheet.xls")
read_excel("my-new-spreadsheet.xlsx")
read_excel("my-spreadsheet.xls", sheet = "data")
read_excel("my-spreadsheet.xls", sheet = 2)
read_excel("my-spreadsheet.xls", na = "NA")
* no es estrictamente cierto, requiere el Rcpp
paquete , que a su vez requiere Rtools (para Windows) o Xcode (para OSX), que son dependencias externas a R. Pero no requieren ninguna manipulación con rutas, etc., así que eso es un ventaja sobre las dependencias de Java y Perl.
Actualización Ahora existe el paquete rexcel . Esto promete obtener formato de Excel, funciones y muchos otros tipos de información del archivo de Excel y en R.
.csv
.