¿Es necesario ajustar los recuentos cero para una prueba de razón de probabilidad de modelos poisson / loglineales?


9

Si hay 0 en la tabla de contingencia y estamos ajustando modelos poisson / loglineales anidados (usando la glmfunción de R ) para una prueba de razón de probabilidad, ¿necesitamos ajustar los datos antes de ajustar los modelos glm (por ejemplo, agregar 1/2 a todos los recuentos)? Obviamente, algunos parámetros no pueden estimarse sin algún ajuste, pero ¿cómo afecta el ajuste / falta de ajuste a la prueba LR?


presumiblemente, la glmrutina se volvería loca si no pudiera manejar los ceros. ¿Lo has probado?
shabbychef

1
Sí, no se bloquea, pero dependiendo de la fórmula (por ejemplo, en un modelo saturado), algunos de los parámetros pueden tener errores estándar infinitos. Mi pregunta es si esto es un problema al hacer una prueba de razón de probabilidad. Todavía puede calcular una probabilidad incluso si algunos parámetros no se estiman, esos parámetros simplemente no contribuirán a la probabilidad. ¿Cuál es la práctica estándar y por qué?
BR1

Respuestas:


7

Uno de los poderes del modelado de regresión en general es que puedes suavizar áreas sin datos, aunque, como has notado, ocasionalmente hay problemas para estimar los parámetros. Sugeriría que si obtiene cosas como errores estándar infinitos, es hora de reconsiderar su enfoque de modelado al poco.

Una nota particular de precaución: hay una diferencia entre "No contar" en un estrato particular, y es imposible que haya conteos en ese estrato. Por ejemplo, imagine que está trabajando en un estudio de trastornos psicológicos para la Marina de los EE. UU. Entre 2000 y 2009, y tiene términos de regresión binaria para "Es una mujer" y "Sirve en un submarino". Un modelo de regresión puede estimar los efectos donde ambas variables = 1 a pesar de tener un conteo cero donde ambas = 1. Sin embargo, esa inferencia no sería válida, tal circunstancia es imposible. Este problema se llama "no positividad" y ocasionalmente es un problema en modelos altamente estratificados.


@ skyguy94 Por extraño que parezca, lo sabía, me había olvidado de notar el uso de un conjunto de datos retrospectivo>. <. Editado para reflejar eso.
Fomite

Re: "Un modelo de regresión puede estimar efectos donde ambas variables = 1, o interacciones entre las dos " - No creo que sea cierto. Si tiene dos predictores binarios que nunca son '1' juntos, entonces la interacción es constante (siempre es '0'), por lo que su efecto no se identifica.
Macro

@Macro Tienes razón, estoy editando un poco. Estaba pensando en términos donde no son indicadores binarios.
Fomite

1
(+1) Entonces, problemas con la no plausibilidad del caso donde ambos = 1 a un lado, la estimación basada en el modelo sería solo la suma de los dos efectos marginales, que sabemos que puede ser muy engañoso en sí mismo :)
Macro
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.