Una forma más sistemática de abordar este problema sería utilizar un modelo de mezcla explícito, con una especificación de la distribución de los "valores atípicos". Una forma simple sería usar una mezcla de una distribución beta (para los puntos que le interesan) y una distribución uniforme (para los "valores atípicos"). Al modelar los datos como una distribución mixta, puede obtener estimaciones deα y β que tienen en cuenta automáticamente el hecho de que algunos de los puntos pueden ser atípicos.
Para resolver este problema utilizando un modelo de mezcla, deje ϕ ser la probabilidad de un "valor atípico" y asumir que tiene valores IID X1,...,Xn∼ϕ⋅U(0,1)+(1−ϕ)⋅Beta(α,β). La función de probabilidad de los datos observados es:
Lx(α,β,ϕ)=∏i=1n(ϕ+(1−ϕ)Γ(α+β)Γ(α)Γ(β)xα−1i(1−xi)β−1).
Puede proceder desde aquí utilizando MLE clásico o estimación bayesiana. Cualquiera de las dos requerirá técnicas numéricas. Después de haber estimado los tres parámetros en el modelo, tendría una estimación de y que incorpora automáticamente la posibilidad de valores atípicos. También tendría una estimación de la proporción de valores atípicos del modelo de mezcla.αβ