He estado leyendo sobre la validación de k-fold, y quiero asegurarme de que entiendo cómo funciona.
Sé que para el método de retención, los datos se dividen en tres conjuntos, y el conjunto de prueba solo se usa al final para evaluar el rendimiento del modelo, mientras que el conjunto de validación se usa para ajustar hiperparámetros, etc.
En el método k-fold, ¿todavía tenemos un conjunto de prueba para el final, y solo usamos los datos restantes para el entrenamiento y el ajuste de hiperparámetros, es decir, dividimos los datos restantes en k pliegues, y luego usamos la precisión promedio después del entrenamiento con cada pliegue (o cualquier métrica de rendimiento que elijamos para ajustar nuestros hiperparámetros)? ¿O no usamos un conjunto de pruebas por separado y simplemente dividimos todo el conjunto de datos en k pliegues (si este es el caso, supongo que solo consideramos que la precisión promedio en los k pliegues es nuestra precisión final)?