Tradicionalmente, la inferencia estadística se enseña en el contexto de las muestras de probabilidad y la naturaleza del error de muestreo. Este modelo es la base para la prueba de significancia. Sin embargo, hay otras formas de modelar desviaciones sistemáticas del azar y resulta que nuestras pruebas paramétricas (basadas en muestreo) tienden a ser buenas aproximaciones de estas alternativas.
Las pruebas paramétricas de hipótesis se basan en la teoría de muestreo para producir estimaciones de error probable. Si se toma una muestra de un tamaño dado de una población, el conocimiento de la naturaleza sistemática del muestreo hace que las pruebas y los intervalos de confianza sean significativos. Con una población, la teoría de muestreo simplemente no es relevante y las pruebas no son significativas en el sentido tradicional. La inferencia es inútil, no hay nada que inferir, solo está la cosa ... el parámetro en sí.
Algunos evitan esto apelando a las superpoblaciones que representa el censo actual. Considero que estas apelaciones no son convincentes: las pruebas paramétricas se basan en el muestreo de probabilidad y sus características. Una población en un momento dado puede ser una muestra de una población más grande a lo largo del tiempo y el lugar. Sin embargo, no veo ninguna forma en que uno pueda argumentar legítimamente que esta es una muestra aleatoria (o más generalmente cualquier forma de probabilidad). Sin una muestra de probabilidad, la teoría de muestreo y la lógica tradicional de prueba simplemente no se aplican. También puede realizar una prueba con base en una muestra de conveniencia.
Claramente, para aceptar las pruebas cuando se utiliza una población, debemos prescindir de esas pruebas en los procedimientos de muestreo. Una forma de hacerlo es reconocer la estrecha conexión entre nuestras pruebas teóricas de muestra, como t, Z y F, y los procedimientos de aleatorización. Las pruebas de aleatorización se basan en la muestra disponible. Si recopilo datos sobre el ingreso de hombres y mujeres, el modelo de probabilidad y la base de nuestras estimaciones de error son asignaciones aleatorias repetidas de los valores de datos reales. Pude comparar las diferencias observadas entre los grupos con una distribución basada en esta aleatorización. (Hacemos esto todo el tiempo en experimentos, por cierto, donde el muestreo aleatorio de un modelo de población rara vez es apropiado).
Ahora, resulta que las pruebas teóricas de muestra son a menudo buenas aproximaciones de las pruebas de aleatorización. Entonces, en última instancia, creo que las pruebas de poblaciones son útiles y significativas dentro de este marco y pueden ayudar a distinguir la variación sistemática de la casualidad, al igual que con las pruebas basadas en muestras. La lógica utilizada para llegar allí es un poco diferente, pero no tiene mucho efecto sobre el significado práctico y el uso de las pruebas. Por supuesto, podría ser mejor usar pruebas de aleatorización y permutación directamente dado que están fácilmente disponibles con toda nuestra potencia informática moderna.