Respuestas:
Hay bastante discusión sobre esto en el sitio AP .
Puede usar cualquier estadística que desee, siempre que tenga claro lo que hace y observe la distribución nula adecuada para calcular los valores p o umbrales.
Pero algunas estadísticas son mejores que otras; en este caso, estaría buscando (a) distribución nula fácilmente calculada y (b) potencia para detectar la diferencia.
Pero no sé por qué favorecería la varianza no agrupada sobre la varianza agrupada para la prueba, aunque podría ser preferible al calcular un intervalo de confianza para la diferencia.
La varianza no agrupada tiende a ser demasiado pequeña. Esto se debe a que, bajo la hipótesis nula, seguirá habiendo variación por azar en las dos proporciones observadas, aunque las probabilidades subyacentes son iguales. Esta variación aleatoria contribuye a la varianza agrupada pero no a la varianza no agrupada.
Como resultado, para la estadística no agrupada ni siquiera tiene aproximadamente una distribución normal estándar. Por ejemplo, cuando y las verdaderas probabilidades son ambas , la varianza de es solo lugar de . Al usar tablas de la distribución normal estándar, obtendrá valores p incorrectos: tenderán a ser artificialmente pequeños, rechazando con demasiada frecuencia el valor nulo cuando la evidencia no está realmente allí.
Sin embargo, uno se pregunta si esto podría corregirse. Puede. La pregunta es si un valor corregido de , basado en estimaciones no agrupadas, podría tener un mayor poder para detectar desviaciones de la hipótesis nula. Algunas simulaciones rápidas sugieren que este no es el caso: la prueba agrupada (en comparación con una prueba no agrupada ajustada correctamente) tiene una mejor oportunidad de rechazar el valor nulo siempre que el valor nulo sea falso. Por lo tanto, no me he molestado en elaborar la fórmula para la corrección no agrupada; Parece inútil.
En resumen, la prueba no agrupada es incorrecta, pero con una corrección adecuada, puede hacerse legítima. Sin embargo, parece ser inferior a la prueba combinada.