Los conjuntos de validación más grandes proporcionan estimaciones más precisas del rendimiento fuera de la muestra. Pero como ha notado, en algún momento esa estimación puede ser tan precisa como lo necesita, y puede hacer algunas predicciones aproximadas sobre el tamaño de la muestra de validación que necesita para llegar a ese punto.
Para una precisión de clasificación simple correcta / incorrecta, puede calcular el error estándar de la estimación como (desviación estándar de una variable de Bernouilli), donde es la probabilidad de una clasificación correcta, y es el tamaño del conjunto de validación. Por supuesto que no conoce , pero es posible que tenga una idea de su rango. Por ejemplo, supongamos que espera una precisión entre 60-80% y desea que sus estimaciones tengan un error estándar menor que 0.1%:
¿Qué tan grande debería ser (el tamaño de el conjunto de validación) ser? Para obtenemos:
Para pnp √p(1−p)/n−−−−−−−−−√pnpnp=0.6n> 0.6 - 0.6 2
p(1−p)/n−−−−−−−−−√<0.001
np=0.6p=0.8n>0.8-0.82n>0.6−0.620.0012=240,000
p=0.8obtenemos:
Así que esto nos dice que podría salirse con el uso de menos del 5% de sus 5 millones de muestras de datos, para su validación. Este porcentaje disminuye si espera un mayor rendimiento, o especialmente si está satisfecho con un error estándar más bajo de su estimación de rendimiento fuera de muestra (por ejemplo, con y para un se <1%, solo necesita 2100 muestras de validación , o menos del veinte por ciento de sus datos).
p=0.7n>0.8−0.820.0012=160,000
p=0.7
Estos cálculos también muestran el punto hecho por Tim en su respuesta, que la precisión de sus estimaciones depende del tamaño absoluto de su conjunto de validación (es decir, en ), en lugar de su tamaño en relación con el conjunto de entrenamiento.n
(También podría agregar que estoy asumiendo un muestreo representativo aquí. Si sus datos son muy heterogéneos, es posible que necesite usar conjuntos de validación más grandes solo para asegurarse de que los datos de validación incluyan las mismas condiciones, etc., que los datos de su tren y prueba. )