Hay una variedad de soluciones para el caso de distribuciones continuas (semi-) infladas a cero:
- Regresión de Tobit : supone que los datos provienen de una única distribución Normal subyacente, pero que los valores negativos están censurados y apilados en cero (por ejemplo, paquete censReg )
- obstáculo o modelo de "dos etapas": use un modelo binomial para predecir si los valores son 0 o> 0, luego use un modelo lineal (o Gamma, o Normal truncado, o log-Normal) para modelar los valores observados distintos de cero
- 1 < p < 2x > 0
O, si su estructura de datos es lo suficientemente simple, puede usar modelos lineales y usar pruebas de permutación o algún otro enfoque sólido para asegurarse de que su inferencia no se vea afectada por la interesante distribución de los datos.
Hay paquetes / soluciones R disponibles para la mayoría de estos casos.
Hay otras preguntas sobre SE sobre los datos continuos (semi) ceros inflados (por ejemplo, aquí , aquí y aquí ), pero no parecen ofrecer una respuesta general clara ...
Consulte también Min & Agresti, 2002, Modelado de datos no negativos con agrupamiento en cero: una encuesta para obtener una descripción general.