Tengo algunos datos en [0,1] que me gustaría analizar con una regresión beta. Por supuesto, hay que hacer algo para acomodar los valores de 0,1. No me gusta modificar los datos para que se ajusten a un modelo. Tampoco creo que la inflación cero y 1 sea una buena idea porque creo que en este caso uno debería considerar los 0 como valores positivos muy pequeños (pero no quiero decir exactamente qué valor es apropiado. Una elección razonable Creo que sería elegir valores pequeños como .001 y .999 y ajustar el modelo usando la dist acumulativa para la beta. Entonces, para las observaciones y_i, la probabilidad de registro LL_ sería
if y_i < .001 LL+=log(cumd_beta(.001))
else if y_i>.999 LL+=log(1.0-cum_beta(.999))
else LL+=log(beta_density(y_i))
Lo que me gusta de este modelo es que si el modelo de regresión beta es válido, este modelo también es válido, pero elimina un poco de la sensibilidad a los valores extremos. Sin embargo, este parece ser un enfoque tan natural que me pregunto por qué no encuentro referencias obvias en la literatura. Entonces mi pregunta es en lugar de modificar los datos, ¿por qué no modificar el modelo? La modificación de los datos sesga los resultados (en base al supuesto de que el modelo original es válido), mientras que la modificación del modelo combinando los valores extremos no sesga los resultados.
Tal vez hay un problema que estoy pasando por alto?