Preguntas etiquetadas con cross-validation

Retener repetidamente subconjuntos de datos durante el ajuste del modelo para cuantificar el rendimiento del modelo en los subconjuntos de datos retenidos.




3
¿Validación cruzada o bootstrapping para evaluar el rendimiento de la clasificación?
¿Cuál es el método de muestreo más apropiado para evaluar el rendimiento de un clasificador en un conjunto de datos en particular y compararlo con otros clasificadores? La validación cruzada parece ser una práctica estándar, pero he leído que métodos como .632 bootstrap son una mejor opción. Como seguimiento: ¿La …

1
¿Quién inventó la validación cruzada k-fold?
Estoy buscando una referencia al documento donde se introdujo la validación cruzada k-fold (en lugar de solo una buena referencia académica para el tema). Quizás esté demasiado atrás en la bruma del tiempo para identificar inequívocamente el primer artículo, por lo que cualquier documento inicial en el que se utilizó …

2
¿Por qué lambda "dentro de un error estándar del mínimo" es un valor recomendado para lambda en una regresión neta elástica?
Entiendo qué papel juega lambda en una regresión de red elástica. Y puedo entender por qué uno seleccionaría lambda.min, el valor de lambda que minimiza el error de validación cruzada. Mi pregunta es ¿En qué parte de la literatura estadística se recomienda usar lambda.1se, que es el valor de lambda …

1
La validación cruzada (CV) y las estadísticas de validación cruzada generalizada (GCV)
He encontrado definiciones posiblemente contradictorias para el estadístico de validación cruzada (CV) y para el estadístico de validación cruzada generalizada (GCV) asociado con un modelo lineal Y=Xβ+εY=Xβ+εY = X\boldsymbol\beta + \boldsymbol\varepsilon (con un vector de error normal, homoscedastic εε\boldsymbol\varepsilon ). Por un lado, Golub, Heath y Wahba definen la estimación …



4
¿Por qué los investigadores usan la validación cruzada 10 veces en lugar de probar en un conjunto de validación?
He leído muchos trabajos de investigación sobre clasificación de sentimientos y temas relacionados. La mayoría de ellos utilizan validación cruzada 10 veces para entrenar y probar clasificadores. Eso significa que no se realiza ninguna prueba / validación por separado. ¿Porqué es eso? ¿Cuáles son las ventajas / desventajas de este …





2
Elegir alfa óptimo en regresión logística neta elástica
Estoy realizando una regresión logística de red elástica en un conjunto de datos de atención médica usando el glmnetpaquete en R seleccionando valores lambda en una cuadrícula de de 0 a 1. Mi código abreviado está a continuación:αα\alpha alphalist <- seq(0,1,by=0.1) elasticnet <- lapply(alphalist, function(a){ cv.glmnet(x, y, alpha=a, family="binomial", lambda.min.ratio=.001) …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.