Preguntas etiquetadas con cross-validation

Retener repetidamente subconjuntos de datos durante el ajuste del modelo para cuantificar el rendimiento del modelo en los subconjuntos de datos retenidos.

2
PRESIONE la estadística para la regresión de cresta
En mínimos cuadrados ordinarios, regresando un vector objetivo yyy contra un conjunto de predictores XXX, la matriz del sombrero se calcula como H= X(XtX)- 1XtH=X(XtX)−1XtH = X (X^tX)^{-1} X^t y la PRENSA (suma residual de cuadrados prevista) se calcula mediante SSPAGS=∑yo(miyo1 -hyo i)2SSP=∑i(ei1−hii)2SS_P = \sum_i \left( \frac{e_i}{1-h_{ii}}\right)^2 dónde miyoeie_i es …

2
Validación cruzada en una dimensión muy alta (para seleccionar el número de variables utilizadas en una clasificación dimensional muy alta)
Mi pregunta es acerca de la validación cruzada cuando hay muchas más variables que observaciones. Para arreglar ideas, propongo restringir al marco de clasificación en una dimensión muy alta (más características que observación). Problema: Suponga que para cada variable tiene una medida de importancia que medir exactamente el interés de …


1
¿Cómo obtener hiperparámetros óptimos después de la validación cruzada anidada?
En general, si tenemos un gran conjunto de datos, podemos dividirlo en (1) capacitación, (2) validación y (3) prueba. Utilizamos la validación para identificar los mejores hiperparámetros en la validación cruzada (por ejemplo, C en SVM) y luego entrenamos el modelo usando los mejores hiperparámetros con el conjunto de entrenamiento …

1
¿Cómo interpretar el diagrama cv.glmnet ()?
Realicé el lazo y luego dejé una validación cruzada cv<-cv.glmnet(df, df$Price, nfolds = 1500) Cuando trazo cv me sale lo siguiente: También noté que obtengo 2 lambdas diferentes: lambda.minylambda.1se ¿Cuál es la diferencia entre estas lambdas? ¿Qué puedo entender de la gráfica anterior en general (de qué se tratan estos …

3
Parada temprana vs validación cruzada
Actualmente estoy usando una parada temprana en mi trabajo para evitar un ajuste excesivo. Específicamente, los que se tomaron antes de parar pero ¿cuándo? . Ahora quiero comparar con otros algoritmos de clasificación donde parece que la validación cruzada 10 veces se usa ampliamente. Sin embargo, estoy confundido acerca de …



2
Tratar con un buen desempeño en los datos de capacitación y validación, pero muy mal desempeño en los datos de prueba
Tengo un problema de regresión con 5-6k variables. Divido mis datos en 3 conjuntos no superpuestos: capacitación, validación y pruebas. Entreno usando solo el conjunto de entrenamiento y genero muchos modelos de regresión lineal diferentes eligiendo un conjunto diferente de 200 variables para cada modelo (intento aproximadamente 100k de tales …


6
¿El uso de los mismos datos para la selección de características y la validación cruzada está sesgado o no?
Tenemos un pequeño conjunto de datos (alrededor de 250 muestras * 100 características) en el que queremos construir un clasificador binario después de seleccionar el mejor subconjunto de características. Digamos que dividimos los datos en: Entrenamiento, Validación y Pruebas Para la selección de características, aplicamos un modelo de envoltura basado …

3
¿Puedo realizar una búsqueda exhaustiva con validación cruzada para la selección de funciones?
He estado leyendo algunas de las publicaciones sobre selección de características y validación cruzada, pero todavía tengo preguntas sobre el procedimiento correcto. Supongamos que tengo un conjunto de datos con 10 funciones y quiero seleccionar las mejores funciones. Supongamos también que estoy usando un clasificador vecino más cercano. ¿Puedo realizar …




Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.