Desplazamientos en regresiones de Poisson
Comencemos por ver por qué usamos un desplazamiento en una regresión de Poisson. A menudo queremos que esto se deba al control de la exposición. Sea la tasa de referencia por unidad de exposición y el tiempo de exposición en las mismas unidades. El número esperado de eventos será .λtλ × t
En un modelo GLM estamos modelando el valor esperado usando una función de enlace , es decirsol
sol( λ tyo) = log( λ tyo) = β0 0+ β1X1 , yo+ ...
donde es la duración de la exposición para el individuo y es el valor covariable para el individuo . Los puntos suspensivos simplemente indican términos de regresión adicionales que podemos agregar.tyoyoXyoyo
Podemos simplificar simplificando la expresión anterior
Iniciar sesión( λ ) = log( tyo) + β0 0+ β1X1 , yo+ ...
El es simplemente un "desplazamiento" agregado a la regresión de Poisson ya que no es un producto de ninguno de los parámetros del modelo que estaremos estimando.Iniciar sesión( tyo)
Regresión binomial
En una regresión binomial, que generalmente usa un enlace logit, es decir:
sol( pyo) = logit ( pyo) = l o g( pyo1 - pyo) = β0 0+ β1X1 , yo+ ...
Puede ver que será difícil derivar un modelo para que produzca un desplazamiento constante.pagyo
Por ejemplo, si es la probabilidad de que uno cualquier paciente en días tiene un incidente. Será una función de los pacientes individuales disponibles en ese día. Como dijo jboman, es más fácil derivar el cumplido de no incidencia, en lugar de determinar directamente la probabilidad de al menos un incidente. pagyoyo
Sea la probabilidad de que un paciente tenga un incidente el día . La probabilidad de que ningún paciente tenga un incidente el día será , donde es el número de pacientes el día . Por el cumplido, la probabilidad de que al menos un paciente tenga un incidente será, j i i ∏ N i j = 1pag∗i ,jjyoyo∏norteyoj= 1( 1 - p∗i ,j)norteyoyo
pagyo= 1 - ∏j = 1norteyo( 1 -p∗i , j) .
Si estamos dispuestos a asumir que la probabilidad de que un paciente tenga un incidente en cualquier día es la misma, podemos simplificar esto a donde y es la probabilidad de incidencia compartida.q ∗ = 1 - p ∗ p ∗
pagyo= 1 - ( q∗)norteyo,
q∗= 1 - p∗pag∗
Si sustituimos esta nueva definición de en nuestra función de enlace logit , lo mejor que podemos hacer en términos de simplificación y reorganización es . Esto todavía no nos deja con un término constante que se pueda factorizar. g ( p i ) log ( ( q ∗ ) - N - 1 )pagyosol( pyo)Iniciar sesión( ( q∗)- N- 1 )
Como resultado, no podemos usar un desplazamiento en este caso.
Lo mejor que puede hacer es discretizar el problema (como lo sugiere jboman), puede crear contenedores para el número de pacientes y estimar un valor separado para para cada uno de estos contenedores. De lo contrario, deberá derivar un modelo más complicado.pag