He estado usando el -fold validación cruzada varias veces para evaluar el rendimiento de algunos algoritmos de aprendizaje, pero siempre he estado intrigados por la forma en que debería elegir el valor de .K
A menudo he visto y usado un valor de , pero esto me parece totalmente arbitrario, y ahora solo uso por hábito en lugar de pensarlo. Para mí, parece que está obteniendo una mejor granularidad a medida que mejora el valor de , por lo que idealmente debería hacer que su muy grande, pero también existe el riesgo de ser sesgado.10 K K
Me gustaría saber de qué debería depender el valor de y cómo debería pensar en esto cuando evalúe mi algoritmo. ¿Cambia algo si uso la versión estratificada de la validación cruzada o no?