Una compañera de trabajo está analizando algunos datos biológicos para su disertación con cierta heterocedasticidad desagradable (figura a continuación). Lo está analizando con un modelo mixto pero todavía tiene problemas con los residuos.
La transformación logarítmica de las variables de respuesta limpia las cosas y, basándose en la retroalimentación a esta pregunta, este parece ser un enfoque apropiado. Originalmente, sin embargo, habíamos pensado que había problemas al usar variables transformadas con modelos mixtos. Resulta que habíamos estado malinterpretando una declaración en SAS de Littell & Milliken (2006) para modelos mixtos que señalaba por qué no es apropiado transformar los datos de conteo y luego analizarlos con un modelo mixto lineal normal (la cita completa se encuentra a continuación) .
Un enfoque que también mejoró los residuos fue utilizar un modelo lineal generalizado con una distribución de Poisson. He leído que la distribución de Poisson se puede usar para modelar datos continuos (por ejemplo, como se discutió en esta publicación ), y los paquetes de estadísticas lo permiten, pero no entiendo qué sucede cuando el modelo se ajusta.
Con el fin de comprender cómo se realizan los cálculos subyacentes, mis preguntas son: cuando ajusta una distribución de Poisson a datos continuos, 1) ¿se redondean los datos al número entero más cercano? 2) esto da como resultado la pérdida de información y 3) ¿ Cuándo, si alguna vez, es apropiado usar un modelo de Poisson para datos continuos?
Littel & Milliken 2006, pg 529 "transformar los datos [recuento] puede ser contraproducente. Por ejemplo, una transformación puede distorsionar la distribución de los efectos aleatorios del modelo o la linealidad del modelo. Más importante aún, la transformación de los datos deja abierta la posibilidad de recuentos predichos negativos. En consecuencia, la inferencia de un modelo mixto que utiliza datos transformados es altamente sospechosa ".