Sé que el tamaño de la muestra afecta la potencia en cualquier método estadístico. Hay reglas para determinar cuántas muestras necesita una regresión para cada predictor.
También escucho a menudo que el número de muestras en cada categoría en la variable dependiente de una regresión logística es importante. ¿Por qué es esto?
¿Cuáles son las consecuencias reales del modelo de regresión logística cuando el número de muestras en una de las categorías es pequeño (eventos raros)?
¿Existen reglas generales que incorporen tanto el número de predictores como el número de muestras en cada nivel de la variable dependiente?