Preguntas etiquetadas con cross-validation

Retener repetidamente subconjuntos de datos durante el ajuste del modelo para cuantificar el rendimiento del modelo en los subconjuntos de datos retenidos.

2
Alta variación de validación cruzada de dejar uno fuera
Leí una y otra vez que la validación cruzada "Leave-one-out" tiene una gran variación debido a la gran superposición de los pliegues de entrenamiento. Sin embargo, no entiendo por qué es así: ¿no debería ser el rendimiento de la validación cruzada muy estable (baja variación) exactamente porque los conjuntos de …

1
¿Qué pasa si alta precisión de validación pero baja precisión de prueba en investigación?
Tengo una pregunta específica sobre la validación en la investigación de aprendizaje automático. Como sabemos, el régimen de aprendizaje automático les pide a los investigadores que capaciten a sus modelos en los datos de capacitación, que elijan entre los modelos candidatos por conjunto de validación e informen la precisión del …


3
¿Cómo elegir un número óptimo de factores latentes en la factorización matricial no negativa?
Dada una matriz , la factorización de matriz no negativa (NMF) encuentra dos matrices no negativas W m × k y H k × n (es decir, con todos los elementos ≥ 0 ) para representar la matriz descompuesta como:Vm×nVm×n\mathbf V^{m \times n}Wm×kWm×k\mathbf W^{m \times k}Hk×nHk×n\mathbf H^{k \times n}≥0≥0\ge 0 …

1
¿Qué método de comparación múltiple usar para un modelo lmer: lsmeans o glht?
Estoy analizando un conjunto de datos utilizando un modelo de efectos mixtos con un efecto fijo (condición) y dos efectos aleatorios (participante debido al diseño del sujeto y al par). El modelo se ha generado con el lme4paquete: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). A continuación, realicé una prueba de razón de probabilidad de este …


3
¿Cómo hacer un aumento de datos y una división de validación de trenes?
Estoy haciendo clasificación de imágenes usando el aprendizaje automático. Supongamos que tengo algunos datos de entrenamiento (imágenes) y los dividiré en conjuntos de entrenamiento y validación. Y también quiero aumentar los datos (producir nuevas imágenes de las originales) mediante rotaciones aleatorias e inyección de ruido. El aumento se realiza sin …


4
¿Cuáles son los estudios de caso en la investigación de políticas de salud pública en los que se utilizaron incorrectamente estudios o modelos no confiables / confusos / inválidos?
Estoy redactando una revisión de la literatura sobre un problema de salud pública actual en el que los datos se confunden: ¿Cuáles son los estudios de casos históricos comunes que se utilizan en la educación de salud pública / epidemiología donde las relaciones o inferencias inválidas o confusas se emplearon …





2
Scikit forma correcta de calibrar clasificadores con CalibratedClassifierCV
Scikit tiene CalibratedClassifierCV , que nos permite calibrar nuestros modelos en un par X, y particular. También establece claramente quedata for fitting the classifier and for calibrating it must be disjoint. Si deben ser disjuntos, ¿es legítimo entrenar al clasificador con lo siguiente? model = CalibratedClassifierCV(my_classifier) model.fit(X_train, y_train) Me temo …


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.