La validación cruzada probablemente sería buena aquí. Para hacer esto, divide su conjunto de datos en 2 partes. Utiliza la primera parte para ajustar ambos modelos y luego usa el modelo ajustado para predecir la segunda parte. Esto puede justificarse como una aproximación a un enfoque totalmente bayesiano para la selección de modelos. Tenemos la probabilidad de un modeloMi
p (re1re2. . .renorteEl |METROyoyo) = p (re1El |METROyoyo) × p (re2El |re1METROyoyo) × p (re3El |re1re2METROyoyo) × . .
. . × p (renorteEl |re1re2. . .renorte- 1METROyoyo)
Que puede verse heurísticamente como una secuencia de predicciones, y luego de aprender de los errores. Usted predice el primer punto de datos sin entrenamiento. Luego predice el segundo punto de datos después de conocer el modelo con el primero. Luego predice el tercer punto de datos después de usar los dos primeros para aprender sobre el modelo, y así sucesivamente. Ahora, si tiene un conjunto de datos suficientemente grande, entonces los parámetros del modelo estarán bien determinados más allá de una cierta cantidad de datos, y tendremos, por algún valork:
p (rek + 2El |re1. . . .rekrek + 1METROyoyo) ≈ p (rek + 2El |re1. . . .rekMETROyoyo)
El modelo no puede "aprender" más acerca de los parámetros, y básicamente solo predice según el primer kobservaciones Entonces elegiríak (el tamaño del primer grupo) para ser lo suficientemente grande como para que pueda ajustarse con precisión al modelo, 20-30Los puntos de datos por parámetro son probablemente suficientes. También quieres elegirk lo suficientemente grande como para que la dependencia en el rek + 1. . .renorte lo que se ignora no hace que la aproximación sea inútil.
Luego, simplemente evaluaría las probabilidades de cada predicción y tomaría su razón, interpretada como una razón de probabilidad. Si la relación es aproximadamente1, entonces ninguno de los dos modelos es particularmente mejor que el otro. Si está lejos de1entonces esto indica que uno de los modelos está superando al otro. una relación de menos de 5 es débil, 10 es fuerte, 20 muy fuerte y 100, decisiva (correspondiente recíproco para números pequeños).