Para datos longitudinales con un resultado numérico, puedo usar diagramas de espagueti para visualizar los datos. Por ejemplo, algo como esto (tomado del sitio de estadísticas de UCLA):
tolerance<-read.table("http://www.ats.ucla.edu/stat/r/faq/tolpp.csv",sep=",", header=T)
head(tolerance, n=10)
interaction.plot(tolerance$time, tolerance$id, tolerance$tolerance,
xlab="time", ylab="Tolerance", legend=F)
¿Pero qué pasa si mi resultado es binario 0 o 1? Por ejemplo, en los datos de "ohio" en R, la variable binaria "resp" indica la presencia de una enfermedad respiratoria:
library(geepack)
ohio2 <- ohio[2049:2148,]
head(ohio2, n=12)
resp id age smoke
2049 1 512 -2 1
2050 0 512 -1 1
2051 0 512 0 1
2052 0 512 1 1
2053 1 513 -2 1
2054 0 513 -1 1
2055 0 513 0 1
2056 1 513 1 1
2057 1 514 -2 1
2058 0 514 -1 1
2059 0 514 0 1
2060 1 514 1 1
interaction.plot(ohio2$age+9, ohio2$id, ohio2$resp,
xlab="age", ylab="Wheeze status", legend=F)
La trama de espagueti da una buena figura, pero no es muy informativa y no me dice mucho. ¿Cuál sería una forma adecuada de visualizar este tipo de datos? ¿Quizás algo que incluye un valor de probabilidad en el eje y?
ohio
datos (2.15) (al menos no como parte de la base). ¿Está en una versión más nueva o a través de alguna otra biblioteca? Esta sería una aplicación interesante para un mapa de calor con individuos en el eje Y y resultados en el eje X, luego trazar 1 respuestas como negras y 0 respuestas como blancas. La clasificación de la matriz proporcionará una visión general de la prevalencia de los diferentes patrones.
geepack
paquete.