¿Existe realmente alguna diferencia entre la navaja y dejar una validación cruzada? El procedimiento parece idéntico ¿me estoy perdiendo algo?
¿Existe realmente alguna diferencia entre la navaja y dejar una validación cruzada? El procedimiento parece idéntico ¿me estoy perdiendo algo?
Respuestas:
En la validación cruzada, se calcula una estadística en las muestras excluidas. Con mayor frecuencia, predice las muestras excluidas por un modelo construido sobre las muestras guardadas. En jackknifing, calcula una estadística solo de las muestras guardadas.
Jackknife a menudo se refiere a 2 procesos relacionados pero diferentes, los cuales se basan en un enfoque de dejar uno afuera, lo que lleva a esta confusión.
En un contexto, jackknife se puede usar para estimar los parámetros de la población y sus errores estándar. Por ejemplo, para usar un enfoque de navaja para estimar la pendiente y la intersección de un modelo de regresión simple, uno podría:
Los pseudovalores y las estimaciones de los coeficientes de jackknife también se pueden usar para determinar los errores estándar y, por lo tanto, los intervalos de confianza. Por lo general, este enfoque brinda intervalos de confianza más amplios para los coeficientes porque es una medida de incertidumbre mejor y más conservadora. Además, este enfoque también se puede utilizar para obtener una estimación del sesgo de jackknife para los coeficientes.
En el otro contexto, jackknife se utiliza para evaluar el rendimiento del modelo. En este caso jackknife = validación cruzada de dejar uno fuera. Ambos se refieren a dejar una observación fuera del conjunto de datos de calibración, recalibrar el modelo y predecir la observación que quedó fuera. Esencialmente, cada observación se predice usando sus "estimaciones parciales" de los predictores.
Aquí hay un pequeño artículo sobre Jackknife que encontré en línea: https://www.utdallas.edu/~herve/abdi-Jackknife2010-pretty.pdf