La asignación aleatoria es valiosa porque garantiza la independencia del tratamiento de los posibles resultados. Así es como conduce a estimaciones imparciales del efecto promedio del tratamiento. Pero otros esquemas de asignación también pueden garantizar sistemáticamente la independencia del tratamiento de los posibles resultados. Entonces, ¿por qué necesitamos una asignación aleatoria? Dicho de otra manera, ¿cuál es la ventaja de la asignación aleatoria sobre los esquemas de asignación no aleatoria que también conducen a una inferencia imparcial?
Sea un vector de asignaciones de tratamiento en el que cada elemento es 0 (unidad no asignada al tratamiento) o 1 (unidad asignada al tratamiento). En un artículo de JASA , Angrist, Imbens y Rubin (1996, 446-47) dicen que la asignación de tratamiento es aleatoria si \ Pr (\ mathbf {Z} = \ mathbf {c}) = \ Pr (\ mathbf {Z} = \ mathbf {c '}) para todos \ mathbf {c} y \ mathbf {c'} de modo que \ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '} , donde \ iota es un vector de columna con todos los elementos iguales a 1.c c ′ ι T c = ι T c ′ ι
En palabras, la afirmación es que la asignación es aleatoria si cualquier vector de asignaciones que incluye asignaciones al tratamiento es tan probable como cualquier otro vector que incluya asignaciones al tratamiento.
Pero, para garantizar la independencia de los posibles resultados de la asignación al tratamiento, es suficiente garantizar que cada unidad en el estudio tenga la misma probabilidad de asignación al tratamiento. Y eso puede ocurrir fácilmente incluso si la mayoría de los vectores de asignación de tratamiento tienen probabilidad cero de ser seleccionados. Es decir, puede ocurrir incluso bajo asignación no aleatoria.
Aquí hay un ejemplo. Queremos ejecutar un experimento con cuatro unidades en las que se traten exactamente dos. Hay seis posibles vectores de asignación:
- 1100
- 1010
- 1001
- 0110
- 0101
- 0011
donde el primer dígito en cada número indica si la primera unidad fue tratada, el segundo dígito indica si la segunda unidad fue tratada, y así sucesivamente.
Supongamos que realizamos un experimento en el que excluimos la posibilidad de asignar los vectores 3 y 4, pero en el que cada uno de los otros vectores tiene la misma probabilidad (25%) de ser elegido. Este esquema no es una asignación aleatoria en el sentido de AIR. Pero en expectativa, conduce a una estimación imparcial del efecto promedio del tratamiento. Y eso no es casualidad. Cualquier esquema de asignación que proporcione a los sujetos la misma probabilidad de asignación al tratamiento permitirá una estimación imparcial del ATE.
Entonces: ¿por qué necesitamos una asignación aleatoria en el sentido de AIR? Mi argumento tiene sus raíces en la inferencia de aleatorización; Si se piensa en términos de inferencia basada en modelos, ¿la definición de AIR parece más defendible?