Solo para aclarar la relación con el título, no estamos utilizando la distribución t para estimar la media (en el sentido de una estimación puntual al menos), sino para construir un intervalo para ella.
Pero, ¿por qué usar una estimación cuando puede obtener exactamente su intervalo de confianza?
Es una buena pregunta (siempre y cuando no seamos demasiado insistentes en "exactamente", ya que las suposiciones para que sea exactamente distribuida en t no se mantendrán).
"Debe usar la tabla de distribución t cuando trabaje problemas cuando no se conoce la desviación estándar de la población (σ) y el tamaño de la muestra es pequeño (n <30)"
¿Por qué las personas no usan la distribución T todo el tiempo cuando no se conoce la desviación estándar de la población (incluso cuando n> 30)?
Considero el consejo como, en el mejor de los casos, potencialmente engañoso. En algunas situaciones, la distribución t aún debe usarse cuando los grados de libertad son mucho más grandes que eso.
Donde lo normal es una aproximación razonable depende de una variedad de cosas (y así depende de la situación). Sin embargo, dado que (con las computadoras) no es nada difícil usar la t , incluso si la df es muy grande, tendría que preguntarse por qué la necesidad de preocuparse por hacer algo diferente en n = 30.
Si los tamaños de muestra son realmente grandes, no habrá una diferencia notable en un intervalo de confianza, pero no creo que n = 30 siempre esté lo suficientemente cerca de 'realmente grande'.
Hay una circunstancia en la que podría tener sentido usar la normal en lugar de la t : es cuando sus datos claramente no satisfacen las condiciones para obtener una distribución t, pero aún puede argumentar la normalidad aproximada de la media (si n es bastante grande). Sin embargo, en esas circunstancias, a menudo la t es una buena aproximación en la práctica, y puede ser algo "más segura". [En una situación como esa, podría inclinarme a investigar a través de la simulación.]