Modelo lineal general frente a modelo lineal generalizado (¿con una función de enlace de identidad?)

25

Esta es mi primera publicación, así que tómalo con calma si no sigo algunas normas. Hice una búsqueda de mi pregunta y no surgió nada.

Mi pregunta se refiere principalmente a las diferencias prácticas entre el modelado lineal general (GLM) y el modelado lineal generalizado (GZLM). En mi caso, serían algunas variables continuas como covariables y algunos factores en un ANCOVA, frente a GZLM. Quiero examinar los principales efectos de cada variable, así como una interacción de tres vías que esbozaré en el modelo. Puedo ver esta hipótesis siendo probada en un ANCOVA, o usando GZLM. Hasta cierto punto, entiendo los procesos matemáticos y el razonamiento detrás de la ejecución de un modelo lineal general como un ANCOVA, y de alguna manera entiendo que los GZLM permiten una función de enlace que conecta el modelo lineal y la variable dependiente (ok, mentí, tal vez no Realmente entiendo las matemáticas). Lo que realmente no hago No entiendo cuáles son las diferencias prácticas o las razones para ejecutar un análisis y no el otro cuando la distribución de probabilidad utilizada en el GZLM es normal (es decir, ¿función de enlace de identidad?). Obtengo resultados muy diferentes cuando ejecuto uno sobre el otro. ¿Podría correr tampoco? Mis datos son algo no normales, pero funcionan hasta cierto punto tanto en ANCOVA como en GZLM. En ambos casos mi hipótesis es compatible, pero en el GZLM el valor p es "mejor".

Pensé que un ANCOVA es un modelo lineal con una variable dependiente normalmente distribuida que usa una función de enlace de identidad, que es exactamente lo que puedo ingresar en un GZLM, pero estos todavía son diferentes.

¡Por favor, arroja algo de luz sobre estas preguntas para mí, si puedes!

Basado en la primera respuesta tengo la pregunta adicional:

Si son idénticos, excepto por la prueba de significación que utilizó (es decir, la prueba F versus Wald Chi Square), ¿cuál sería el más apropiado para usar? ANCOVA es el "método de acceso", pero no estoy seguro de por qué la prueba F sería preferible. ¿Alguien puede arrojar algo de luz sobre esta pregunta para mí? ¡Gracias!

modeling linear-model

— Behacad
fuente

t

$t$

F

$F$

23

Un modelo lineal generalizado que especifica una función de enlace de identidad y una distribución familiar normal es exactamente equivalente a un modelo lineal (general). Si obtiene resultados notablemente diferentes de cada uno, está haciendo algo mal.

Tenga en cuenta que especificar un enlace de identidad no es lo mismo que especificar una distribución normal. La distribución y la función de enlace son dos componentes diferentes del modelo lineal generalizado, y cada uno se puede elegir independientemente del otro (aunque ciertos enlaces funcionan mejor con ciertas distribuciones, por lo que la mayoría de los paquetes de software especifican la elección de enlaces permitidos para cada distribución).

$p$ $p$ $t$ $F$ $t$ $F$ el software para modelos lineales generalizados también puede usarlos como aproximaciones al ajustar otras familias con un parámetro de escala que se estima a partir de los datos.

— una parada
fuente

¡Gracias por su respuesta! Me alegra escuchar su respuesta, ya que esa fue mi suposición original. Un profesor de mi institución me dijo lo contrario, así que realmente tuve que ir a cavar. Estoy usando SPSS y ahora veo que las estimaciones de los parámetros son de hecho idénticas (por ejemplo, valores B). Ahora veo que lo que me había confundido originalmente eran los diferentes valores de p. La estadística ANCOVA se basa en una prueba F estándar, mientras que el GZLM se basa en el Wald Chi-Square, ¿correcto? He leído que el Wald Chi-Square se usa cuando usas parámetros de la muestra (como en el GZLM).

— Behacad

Basado en esta respuesta, ¡agregué una pregunta a la publicación original!

— Behacad

Ok, he agregado un para correspondiente a mi respuesta en respuesta.

— parada

5

Me gustaría incluir mi experiencia en esta discusión. He visto que un modelo lineal generalizado (que especifica una función de enlace de identidad y una distribución familiar normal) es idéntico a un modelo lineal general solo cuando utiliza la estimación de máxima verosimilitud como método de parámetro de escala. De lo contrario, si se elige "valor fijo = 1" como método de parámetro de escala, obtendrá valores p muy diferentes. Mi experiencia sugiere que generalmente se debe evitar el "valor fijo = 1". Tengo curiosidad por saber si alguien sabe cuándo es apropiado elegir un valor fijo = 1 como método de parámetro de escala. Gracias por adelantado. marca

3

Por lo general, se usa una escala fija solo con modelos como la regresión logística o la regresión de Poisson, donde la respuesta es una variable de conteo o indicador / frecuencia. En este caso no hay un análogo al parámetro de escala en la regresión normal.

— Hong Ooi