El paquete MASS que viene con su R instalado ya tiene la boxcox()
función que puede usar: Después de leer los datos, haga:
library(MASS)
boxcox(y ~ x)
Luego, mire el gráfico que esto produce, que muestra gráficamente un intervalo de confianza del 95% para el parámetro de transformación boxcox. Pero realmente no tiene suficientes datos (n = 10) para hacer esto, el intervalo de confianza resultante va casi de -2 a 2 !, con una estimación de probabilidad máxima de aproximadamente 0 (una transformación logarítmica, como se dijo antes). Si sus datos reales tienen más observaciones, debería intentar esto.
Como han dicho otros, esta transformación realmente está tratando de estabilizar las variaciones. Esto no es realmente obvio desde la teoría, lo que hace es tratar de maximizar una función de probabilidad basada en la distribución normal, que supone una varianza constante. Se podría pensar que maximizar una probabilidad basada en la normalidad trataría de normalizar la distribución de los residuos, pero en la práctica la contribución principal para maximizar la probabilidad proviene de la estabilización de las variaciones. Tal vez esto no sea tan sorprendente, dado que la probabilidad que maximizamos se basa en una familia de distribución normal de varianza constante.
Una vez escribí una demostración basada en slider en XLispStat, que lo demostró claramente.