Mi pregunta es acerca de la validación cruzada cuando hay muchas más variables que observaciones. Para arreglar ideas, propongo restringir al marco de clasificación en una dimensión muy alta (más características que observación).
Problema: Suponga que para cada variable tiene una medida de importancia que medir exactamente el interés de la característica para el problema de clasificación. El problema de seleccionar un subconjunto de características para reducir de manera óptima el error de clasificación se reduce a encontrar el número de características.
Pregunta: ¿Cuál es la forma más eficiente de ejecutar la validación cruzada en este caso (esquema de validación cruzada)? Mi pregunta no es sobre cómo escribir el código, sino sobre la versión de validación cruzada que se debe usar al intentar encontrar el número de características seleccionadas (para minimizar el error de clasificación), sino cómo lidiar con la alta dimensión cuando se realiza la validación cruzada (de ahí el el problema anterior puede ser un poco como un 'problema de juguete' para discutir el CV en alta dimensión).
Notaciones: es el tamaño del conjunto de aprendizaje, p el número de características (es decir, la dimensión del espacio de características). Por muy alta dimensión I media p >> n (por ejemplo y ).