Espero que alguien pueda ayudarme a aclarar un punto de confusión para mí. Digamos que quiero probar si 2 conjuntos de coeficientes de regresión son significativamente diferentes entre sí, con la siguiente configuración:
- , con 5 variables independientes.
- 2 grupos, con tamaños aproximadamente iguales (aunque esto puede variar)
- Se realizarán miles de regresiones similares simultáneamente, por lo que se debe realizar algún tipo de corrección de hipótesis múltiples.
Un enfoque que me sugirieron es usar una prueba Z:
Otro que he visto sugerido en este tablero es introducir una variable ficticia para agrupar y reescribir el modelo como:
, donde es la variable de agrupación, codificada como 0, 1.
Mi pregunta es, ¿en qué se diferencian estos dos enfoques (por ejemplo, diferentes supuestos, flexibilidad)? ¿Es uno más apropiado que el otro? Sospecho que esto es bastante básico, pero cualquier aclaración sería muy apreciada.