Ambas pruebas modelan implícitamente la relación edad-respuesta, pero lo hacen de diferentes maneras. Cuál seleccionar depende de cómo elija modelar esa relación. Su elección debería depender de una teoría subyacente, si hay una; sobre qué tipo de información desea extraer de los resultados; y sobre cómo se selecciona la muestra. Esta respuesta discute estos tres aspectos en orden.
Describiré la prueba t y la regresión logística utilizando un lenguaje que suponga que está estudiando una población de personas bien definida y desea hacer inferencias de la muestra a esta población.
Para admitir cualquier tipo de inferencia estadística, debemos asumir que la muestra es aleatoria.
Una prueba t supone que las personas en la muestra que respondieron "no" son una muestra aleatoria simple de todos los que no respondieron en la población y que las personas en la muestra que respondieron "sí" son una muestra aleatoria simple de todos los que respondieron sí en el población.
Una prueba t hace suposiciones técnicas adicionales sobre las distribuciones de las edades dentro de cada uno de los dos grupos de la población. Existen varias versiones de la prueba t para manejar las posibilidades probables.
La regresión logística supone que todas las personas de cualquier edad son una muestra aleatoria simple de las personas de esa edad en la población. Los grupos de edad separados pueden presentar diferentes tasas de respuestas "sí". Se supone que estas tasas, cuando se expresan como probabilidades logarítmicas (en lugar de proporciones rectas), están relacionadas linealmente con la edad (o con algunas funciones determinadas de la edad).
La regresión logística se extiende fácilmente para acomodar las relaciones no lineales entre la edad y la respuesta. Dicha extensión se puede utilizar para evaluar la plausibilidad del supuesto lineal inicial. Es practicable con grandes conjuntos de datos, que ofrecen suficientes detalles para mostrar no linealidades, pero es poco probable que sean de mucha utilidad con pequeños conjuntos de datos. Una regla general común, que los modelos de regresión deben tener diez veces más observaciones que parámetros, sugiere que se necesitan sustancialmente más de 20 observaciones para detectar la no linealidad (que necesita un tercer parámetro además de la intersección y la pendiente de una función lineal) )
Una prueba t detecta si las edades promedio difieren entre los que respondieron que no y los que sí en la población. Una regresión logística estima cómo la tasa de respuesta varía según la edad. Como tal, es más flexible y capaz de proporcionar información más detallada que la prueba t. Por otro lado, tiende a ser menos potente que la prueba t para el propósito básico de detectar una diferencia entre las edades promedio en los grupos.
Es posible que el par de pruebas exhiba las cuatro combinaciones de significación y no significación. Dos de estos son problemáticos:
La prueba t no es significativa, pero la regresión logística sí lo es. Cuando las suposiciones de ambas pruebas son plausibles, tal resultado es prácticamente imposible, porque la prueba t no está tratando de detectar una relación tan específica como la planteada por la regresión logística. Sin embargo, cuando esa relación es suficientemente no lineal para hacer que los sujetos más viejos y más jóvenes compartan una opinión y los sujetos de mediana edad otra, entonces la extensión de la regresión logística a las relaciones no lineales puede detectar y cuantificar esa situación, que ninguna prueba t podría detectar .
La prueba t es significativa pero la regresión logística no lo es, como en la pregunta. Esto sucede a menudo, especialmente cuando hay un grupo de encuestados más jóvenes, un grupo de encuestados mayores y pocas personas en el medio. Esto puede crear una gran separación entre las tasas de respuesta de los que no responden y los que responden sí. Se detecta fácilmente mediante la prueba t. Sin embargo, la regresión logística tendría relativamente poca información detallada sobre cómo la tasa de respuesta cambia realmente con la edad o de lo contrario tendría información no concluyente: el caso de "separación completa" donde todas las personas mayores responden de una manera y todas las personas más jóvenes de otra manera: pero en ese caso, ambas pruebas generalmente tendrían valores p muy bajos.
Tenga en cuenta que el diseño experimental puede invalidar algunos de los supuestos de la prueba. Por ejemplo, si seleccionó personas según su edad en un diseño estratificado, entonces la suposición de la prueba t (que cada grupo refleja una muestra aleatoria simple de edades) se vuelve cuestionable. Este diseño sugeriría confiar en la regresión logística. Si, en cambio, tuvo dos grupos, uno sin respuesta y otro con respuesta afirmativa, y seleccionado al azar de entre ellos para determinar su edad, entonces los supuestos de muestreo de la regresión logística son dudosos, mientras que los de la prueba t se mantendrán. Ese diseño sugeriría usar alguna forma de prueba t.
(El segundo diseño puede parecer tonto aquí, pero en circunstancias en las que la "edad" se reemplaza por alguna característica que es difícil, costosa o lenta de medir, puede ser atractiva).