Un poco en términos primero. Por definición , la variable de control se mantiene constante durante el estudio, por lo que no puede usarla en regresión. Probablemente se refiera a variables que deberían controlarse estadísticamente . Tales como covariables o factores de bloqueo (como después del diseño experimental de bloques al azar)
Las personas ejecutan regresión o ANOVA con tales variables no solo para eliminar su efecto de las variables predictoras sino principalmente para verificar si su propio efecto es significativo. Si es significativo, su inclusión en el modelo está totalmente garantizada. De lo contrario, es mejor que se excluyan del modelo.
Esto es sobre todo importante para un factor de bloqueo. Si lo deja en el modelo a pesar de que no es significativo, corre el riesgo de perder el efecto de las variables predictoras debido a una disminución en el término df de error , el factor de bloqueo disminuye tanto el error como su df , y parece que existe una situación competitiva. La importancia de los predictores puede subir o bajar dependiendo de "lo que gana" - caída de error suma de cuadrados de caída de su df . Esta puede ser la razón por la cual las personas prefieren modelos más concisos a veces.
Otra razón para esto puede ser que, para muestras tan moderadas como 100 inclusiones, muchos IV, incluso si todos parecen importantes o significativos, conducen a un sobreajuste .