¿Qué paquetes de R te parecen más útiles en tu trabajo diario?


28

Subproceso duplicado: acabo de instalar la última versión de R. ¿Qué paquetes debo obtener?

¿Cuáles son los paquetes R que no podrías imaginar en tu trabajo diario con datos? Enumere las herramientas generales y específicas.

ACTUALIZACIÓN: En cuanto a 24.10.10 ggplot2parece ser el ganador con 7 votos.

Otros paquetes mencionados más de uno son:

  • plyr - 4
  • RODBC, RMySQL- 4
  • sqldf - 3
  • lattice - 2
  • zoo - 2
  • Hmisc/rms - 2
  • Rcurl - 2
  • XML - 2

¡Gracias a todos por sus respuestas!


1
Pregunta muy subjetiva: esta pregunta no se puede responder y no es adecuada para un sitio de control de calidad.
Egon Willighagen

3
Probablemente debería ser wiki comunitario; pregunta útil aquí pero no tiene una respuesta definitiva.
Shane

2
@ Shane: buen punto. movido. @ Egon: subjetivo de hecho. pero si las respuestas provienen de personas conocedoras, no me importa la dosis de subjetividad. Empecé a aprender R recientemente y tengo un par de docenas instaladas para explorar, sin embargo, me doy cuenta de que hay herramientas que uso con mucha más frecuencia, independientemente de la tarea en cuestión.
radek

Sería interesante si StackExchange pudiera admitir algún método para vincular publicaciones wiki de la comunidad en todos los sitios. Porque apuesto a que esta pregunta se ha hecho en Stackoverflow y también creo que el análisis estadístico puede atraer a algunas personas que generalmente no visitarían SO.
Sharpie

@Sharpie: ha habido varias publicaciones SO interesantes como stackoverflow.com/questions/1295955/… o stackoverflow.com/questions/1535021/…, sin embargo, no están enfocadas en paquetes. y estoy de acuerdo, el enlace del wiki de la comunidad podría ser realmente útil.
radek

Respuestas:




8

Yo uso el paquete xtable . El paquete xtable convierte las tablas producidas por R (en particular, las tablas que muestran los resultados de anova) en tablas LaTeX, para ser incluidas en un artículo.



8

ggplot2 : sin duda , la mejor visualización para R.

RMySQL / RSQLite / RODBC - para conectarse a una base de datos

sqldf : manipula data.frames con consultas SQL

Hmisc / rms : paquetes de Frank Harrell que contienen funciones misceláneas convenientes y buenas funciones para análisis de regresión.

GenABEL - paquete agradable para estudios de asociación de genoma completo

Rcmdr : una GUI decente para R si la necesitas.

Consulte también CRANtastic: este enlace tiene una lista de los paquetes R más populares. Muchos de los primeros en la lista ya han sido mencionados


8

¡data.table es mi favorito ahora! Esperamos con ansias la nueva versión con la lista de deseos más implementada.



6

Para mí personalmente, utilizo la mayoría de los siguientes tres paquetes, todos disponibles en el increíble Proyecto Omega para Computación Estadística (no pretendo ser un experto, pero para mis propósitos son muy fáciles de usar):

  • RCurl : Tiene muchas opciones que permiten el acceso a sitios web con los que las funciones predeterminadas en la base R tendrían dificultades, creo que es justo decirlo. Es una interfaz R para la biblioteca libcurl, que tiene el beneficio adicional de que toda una comunidad fuera de R la desarrolla. También disponible en CRAN .

  • XML : es muy indulgente de analizar XML / HTML con formato incorrecto. Es una interfaz R para la biblioteca libxml2 y nuevamente tiene el beneficio adicional de que toda una comunidad fuera de R la desarrolla. También está disponible en CRAN .

  • RJSONIO : permite analizar el texto devuelto por una llamada json y organizarlo en una estructura de lista para su posterior análisis. El competidor de este paquete es rjson pero este tiene la ventaja de ser vectorizado, fácilmente extensible a través de S3 / S4, rápido y escalable a datos grandes.

6

Sweave le permite incrustar código R en un documento LaTeX. Los resultados de ejecutar el código, y opcionalmente el código fuente, se convierten en parte del documento final.

Entonces, en lugar de pegar una imagen producida por R en un archivo LaTeX, puede pegar el código R en el archivo y mantener todo en un solo lugar.


44
Solo una pista para todos aquellos que desean comenzar una investigación reproducible con R. Les recomendaría que echen un vistazo al paquete más nuevo en knitrlugar de Sweave. Básicamente es Sweave con esteroides. Es tan fácil, si no más fácil, aprender y mucho más flexible.
Christoph_J


4

Encuentro celosía junto con el libro complementario "Celosía: visualización de datos multivariados con R" de Deepayan Sarkar invaluable.


4

Si está haciendo algún tipo de modelado predictivo, caret es un regalo del cielo. Especialmente combinado con el paquete multinúcleo , son posibles algunas cosas bastante sorprendentes.


4

Día a día, el paquete más útil debe ser "extranjero", que tiene funciones para leer y escribir datos para otros paquetes estadísticos, por ejemplo, Stata, SPSS, Minitab, SAS, etc. Trabajar en un campo donde R no es tan común significa que esto Es un paquete muy importante.


3

yo suelo

car, doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplots, gtools), Hmisc, plyr, RCurl, RDCOMClient, rehape, RODBC, TeachingDemos, XML.

mucho.


3

No podría vivir sin:

  • celosía para gráficos
  • xlsx o XLConnect para leer archivos de Excel
  • rtf para crear informes en formato rtf (preferiría Sword o R2wd pero no puedo instalar statconn en el trabajo; seguramente intentaré odfWeave pronto).
  • nlme y lme4 para modelos mixtos
  • ff para trabajar con matrices grandes

2

RODBC para acceder a datos de bases de datos, sqldf para realizar consultas SQL simples en marcos de datos (aunque me estoy obligando a usar comandos R nativos), y ggplot2 y plyr



2

Usamos principalmente:

  • ggplot - para gráficos
  • estadísticas
  • e1071 - para SVM

También puede consultar kernlab y buscar SVM. Son alternativas interesantes (no necesariamente mejores).
Zach


2

Para mí, estoy usando kernlab para el laboratorio de aprendizaje automático basado en kernel y e1071 para SVM y ggplot2 para gráficos


2

Yo uso ggplot2, vegano y remodelar con bastante frecuencia.




2

Soy un gran admirador de RCPP cuando necesito un bucle rápido o para realizar tratamientos que no cumplen con R. Está muy bien implementado en el sistema R eco, puede recibir Matrix / Matrix dispersa sin conversión como argumentos en una función.

La sintaxis de C ++ es fácil cuando haces cosas simples (que a menudo es mi caso).

Realmente, no necesitas ser un creador de paquetes para necesitar esta increíble lib.

¿Dije que C ++ es muy rápido?


2

¡Los paquetes doParallel y foreach me han hecho la vida mucho más fácil al permitirme paralelizar mi código y ejecutarlo en una instancia de cómputo optimizado en Amazon EC2 ! Los uso muy a menudo. Pero eso no hubiera sido posible sin las AMI RStudio lanzadas por Louis Aslett. Finalmente, tengo que mencionar el paquete stringr que realmente hace que trabajar con cuerdas sea un paseo por el parque. Úselo en todas las aplicaciones de minería de texto. Y también utilizo knitr con mucha frecuencia para producir informes de alta calidad de mi trabajo. Muchas gracias por este increíble paquete Yihui Xie!


1

Utilizo ggplot2, rehape, lattice, knitr con más frecuencia.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.