¿Conoces una referencia o nombre para la siguiente forma de investigar si una técnica de modelado compleja es parcial?
- Aplicar al conjunto de datos original. Mida su rendimiento (por ejemplo, R cuadrado en la configuración de regresión).
- Permuta aleatoriamente la variable de respuesta para obtener un nuevo conjunto de datos. Aplicar y medir su rendimiento . [Si las observaciones son dependientes, este paso es más complicado.]
Si es sustancialmente diferente del rendimiento cero, concluimos es parcial
El paso 2 puede repetirse si los recursos lo permiten, lo que llevaría a la distribución nula de permutación de la medida de rendimiento. Pero en mi aplicación, no puedo hacer esto debido a problemas de recursos.
Recuerdo sombríamente que este truco de "reorganización" fue utilizado por alguien para investigar el sesgo de la validación cruzada de dejar uno fuera (en algún contexto). Sin embargo, no sé si estaba en mi situación en la que podría repetir todo el proceso solo una vez.
Un ejemplo en R que muestra el "poder" de la ingenua selección hacia atrás:
# Generate random data set. Only random performance is expected.
n <- 100
p <- 30
set.seed(7567)
y <- rnorm(n)
X <- rnorm(n*p)
dim(X) <- c(n, p)
data <- data.frame(y, X)
# Modelling technique: backward selection with OLS
T <- function(data) {
step(lm(y ~ ., data = data), trace = 0)
}
# Performance: R-squared
P <- function(fit) {
summary(fit)$r.squared
}
# Step 1: Compute performance on original data. Happily publish high R-squared...
P(T(data)) # 0.240405
# Step 2: Your mean colleague reshuffles response and gets also R-squared far away from 0
data$y <- data$y[sample(n)]
P(T(data)) # 0.1925726
Conclusión sobre el ejemplo: la técnica de modelado elegida es extremadamente propensa al sobreajuste, al menos en este entorno específico.
Algunos antecedentes
Una vez he usado este truco de reorganización para verificar si la validación cruzada de algún tedioso proceso de modelado fue implementada adecuadamente por mí. Bajo una permutación aleatoria, CV dio un R cuadrado de esencialmente 0 (como se esperaba / deseó).