Una pregunta más productiva podría ser "¿por qué no se usó en las estadísticas clásicas que aprendí?"
Dependiendo del nivel o niveles en los que se enseñó, el contenido del curso (y el tiempo disponible) de esa elección puede deberse a una combinación de varios factores. A menudo, los temas importantes se dejan de lado porque se debe enseñar otro material por una razón u otra, con la esperanza de que se cubran en materias posteriores.
Al menos en algunos sentidos, la noción ha sido utilizada durante mucho tiempo por una variedad de personas. Era más común en algunas áreas que en otras. Muchos usos de las estadísticas no tienen predicción o selección de modelo como un componente principal (o en algunos casos, incluso en absoluto), y en ese caso, el uso de muestras de reserva puede ser menos crítico que cuando la predicción es el punto principal. Podría decirse que debería haber ganado un uso más extendido en una etapa anterior en algunas aplicaciones relevantes de lo que lo hizo, pero eso no es lo mismo que ser desconocido.
Si observa áreas que se centran en la predicción, la noción de evaluación del modelo al predecir los datos que no usó para estimar su modelo ciertamente existió (aunque no es universal). Ciertamente lo estaba haciendo con el modelo de series de tiempo que estaba haciendo en la década de 1980, por ejemplo, donde el rendimiento predictivo fuera de la muestra de los datos más recientes era particularmente importante.
La noción de omitir al menos algunos datos se usó en la regresión (residuos eliminados, PRENSA, Jacknife, etc.) y en análisis atípicos, por ejemplo.
Algunas de estas ideas datan mucho antes todavía. Stone (1974) [1] se refiere a documentos sobre validación cruzada (con la palabra en el título) de los años 50 y 60. Quizás incluso más cerca de su intención, menciona el uso de Simon (1971) de los términos "muestra de construcción" y "muestra de validación", pero también señala que "Larson (1931) empleó la división aleatoria de la muestra en un múltiplo educativo -regresión de estudio ".
Temas como la validación cruzada y el uso de estadísticas basadas en predicciones, etc., se estaban volviendo sustancialmente más frecuentes en la literatura estadística en los años 70 y 80, por ejemplo, pero muchas de las ideas básicas han existido durante bastante tiempo incluso luego.
[1]: Stone, M., (1974)
"Cross-Validatory Choice and Assessment of Statistic Predictions",
Journal of the Royal Statistical Society. Serie B (Metodológica) , vol. 36, núm. 2., págs. 111-147