La trinidad de las pruebas con la máxima probabilidad: ¿qué hacer ante las conclusiones contradictorias?

10

Las pruebas de Wald, Razón de probabilidad y Multiplicador de Lagrange en el contexto de la estimación de máxima verosimilitud son asintóticamente equivalentes. Sin embargo, para muestras pequeñas, tienden a divergir bastante y, en algunos casos, dan lugar a conclusiones diferentes.

¿Cómo pueden clasificarse según la probabilidad de que rechacen el nulo? ¿Qué hacer cuando las pruebas tienen respuestas conflictivas? ¿Puedes elegir la que da la respuesta que deseas o hay una "regla" o "directriz" sobre cómo proceder?

hypothesis-testing maximum-likelihood

— Vivi
fuente

¿Es este, quizás, un caso en el que las aproximaciones asintóticas a las distribuciones [nulas] de una o más de las tres estadísticas de prueba no son tan buenas? ¿Quizás los resultados difieren porque los tamaños reales de las pruebas son diferentes? ¿Qué tan grandes son sus tamaños de muestra?

— ronaf

5

No conozco la literatura en el área lo suficientemente bien como para ofrecer una respuesta directa. Sin embargo, me parece que si las tres pruebas difieren, eso es una indicación de que necesita más investigación / recopilación de datos para responder definitivamente a su pregunta.

Es posible que también desee ver esta búsqueda de Google Académico

Actualiza en respuesta a tu comentario:

Si no es posible recopilar datos adicionales, entonces hay una solución alternativa. Realice una simulación que refleje su estructura de datos, tamaño de muestra y su modelo propuesto. Puede configurar los parámetros a algunos valores predeterminados. Estime el modelo utilizando los datos generados y luego verifique cuál de las tres pruebas lo señala al modelo correcto. Tal simulación ofrecería alguna guía sobre qué prueba usar para sus datos reales. ¿Tiene sentido?

1

¿Te refieres a un artículo en particular? Me imagino que podría encontrar una respuesta a mi pregunta si investigara, estudiara, leyera mucho, pero también el 95% de las preguntas que otras personas hacen aquí ... También, en algunos casos, particularmente con datos macroeconómicos (que es mi área ), no hay más datos para recopilar. Los datos son escasos (la cantidad de observaciones, quiero decir), y solo tienes que vivir con ellos. No existe una solución para "obtener más datos". Esperaba que alguien aquí supiera el tema, pero no parece. ¿Quizás una vez que el sitio web esté abierto al público en general?

— Vivi

Sospecho que la respuesta a su pregunta será específica del dominio / modelo y, por lo tanto, no estoy seguro de poder recomendar un documento específico.

1

Lo siento por la respuesta tardía. Me gusta tu sugerencia de simulación. Sin embargo, eso no es realmente fácil. La verdad es que lo que veo en la práctica es que los investigadores solo hacen la prueba que es computacionalmente más fácil o que les da el resultado que desean.

— Vivi

8

No daré una respuesta definitiva en términos de clasificación de los tres. Cree un IC del 95% alrededor de sus parámetros en función de cada uno, y si son radicalmente diferentes, entonces su primer paso debería ser profundizar. Transforme sus datos (aunque el LR será invariable), regularice su probabilidad, etc. Sin embargo, probablemente optaría por la prueba de LR y el IC asociado. Sigue un rudo argumento.

El LR es invariable bajo la opción de parametrización (por ejemplo, T versus logit (T)). La estadística de Wald supone la normalidad de (T - T0) / SE (T). Si esto falla, su CI es malo. Lo bueno de LR es que no necesita encontrar una transformación f (T) para satisfacer la normalidad. El IC del 95% basado en T será el mismo. Además, si su probabilidad no es cuadrática, el IC del 95% de Wald, que es simétrico, puede ser extraño ya que puede preferir valores con menor probabilidad a aquellos con mayor probabilidad.

Otra forma de pensar sobre el LR es que está utilizando más información, en términos generales, de la función de probabilidad. El Wald se basa en el MLE y la curvatura de la probabilidad en nulo. La puntuación se basa en la pendiente en nulo y la curvatura en nulo. El LR evalúa la probabilidad bajo el nulo, y la probabilidad bajo la unión del nulo y la alternativa, y combina los dos. Si se ve obligado a elegir uno, esto puede ser intuitivamente satisfactorio para elegir el LR.

Tenga en cuenta que hay otras razones, como la conveniencia o la computación, para optar por Wald o Score. El Wald es el más simple y, dado un parámetro multivariante, si está probando establecer muchos valores individuales en 0, hay formas convenientes de aproximar la probabilidad. O si desea agregar una variable a la vez de algún conjunto, es posible que no desee maximizar la probabilidad de cada nuevo modelo, y la implementación de las pruebas de Puntuación ofrece alguna conveniencia aquí. El Wald y el Score se vuelven atractivos a medida que sus modelos y probabilidades se vuelven poco atractivos. (Pero no creo que esto sea lo que estaba cuestionando, ya que tiene los tres disponibles ...)

— ars
fuente