@Ondrej y @Michelle han proporcionado buena información aquí. Me pregunto si puedo contribuir abordando algunos puntos no mencionados en otra parte. No me castigaría por no poder obtener mucho de los datos en forma tabular, las tablas generalmente no son una muy buena forma de presentar información (cf. Gelman et al., Convertir tablas en gráficos ). Por otro lado, pedir una herramienta que genere automáticamente todos los gráficos correctos para ayudarlo a explorar un nuevo conjunto de datos es casi como pedir una herramienta que piense por usted. (No lo tome de la manera incorrecta, reconozco que su pregunta deja en claro que no irá tan lejos; solo quiero decir que realmente nunca habrá una herramienta así.) Se puede encontrar una buena discusión relacionada con esto aquí .
Habiendo dicho estas cosas, quería hablar un poco sobre los tipos de parcelas que es posible que desee utilizar para explorar sus datos. Las parcelas enumeradas en la pregunta serían un buen comienzo, pero podríamos optimizarlo un poco. Para empezar, hacer "una gran cantidad de gráficos" correlacionando pares de variables podría no ser ideal. Un diagrama de dispersión solo muestra la relación marginal entre dos variables. Las relaciones importantes a menudo se pueden ocultar en alguna combinación de múltiples variables. Entonces, la primera forma de reforzar este enfoque es hacer una matriz de diagrama de dispersiónque muestra todos los diagramas de dispersión por pares simultáneamente. Las matrices de diagrama de dispersión se pueden mejorar de varias maneras: por ejemplo, se pueden combinar con gráficos de densidad de núcleo univariados de la distribución de cada variable, se pueden usar diferentes marcadores / colores para trazar diferentes grupos, y se pueden evaluar posibles relaciones no lineales superponiendo un ajuste de loess. La scatterplot.matrix
función en el paquete del automóvil en R puede hacer todas estas cosas muy bien (se puede ver un ejemplo a la mitad de la página vinculada anteriormente).
Sin embargo, aunque las matrices de diagrama de dispersión son un buen comienzo, todavía solo muestran las proyecciones marginales. Hay algunas maneras de intentar ir más allá de esto. Una es explorar gráficas tridimensionales usando el paquete rgl en R. Otro enfoque es usar gráficas condicionales; Los coplots pueden ayudar con las relaciones entre 3 o 4 variables simultáneamente. Un enfoque especialmente útil es usar una matriz de diagrama de dispersión interactivamente(aunque esto requerirá más esfuerzo para aprender), por ejemplo, 'cepillando'. El cepillado le permite resaltar un punto o puntos en un cuadro de una matriz y esos puntos se resaltarán simultáneamente en todos los otros cuadros. Al mover el pincel, puede ver cómo cambian todas las variables juntas. ACTUALIZACIÓN: Otra posibilidad que olvidé mencionar es usar un diagrama de coordenadas paralelas . Esto tiene la desventaja de no distinguir su variable de respuesta, pero podría ser útil, por ejemplo, para examinar las correlaciones entre sus variables X.
También quiero felicitarlo por examinar sus datos ordenados por fecha de recopilación. Aunque los datos siempre se recopilan con el tiempo, las personas no siempre hacen esto. Trazar un gráfico lineal es bueno, pero sugeriría que lo complemente con gráficos de autocorrelaciones y autocorrelaciones parciales . En R, las funciones para estos son acf
y pacf
respectivamente.
Reconozco que todo esto no responde a su pregunta en el sentido de darle una herramienta que hará todas las tramas automáticamente, pero una implicación es que en realidad no tendría que hacer tantas tramas como teme. , por ejemplo, una matriz de diagrama de dispersión es solo una línea de código. Además, en R, debería ser posible escribir una función / algún código reutilizable para usted que automatizaría en parte parte de esto (p. Ej., Puedo imaginar una función que incluya una lista de variables y un orden de fechas, las clasifique) , aparece una nueva ventana para cada una con gráficos de línea, acf y pacf).