Seguro. John Tukey describe una familia de transformaciones (crecientes, uno a uno) en EDA . Se basa en estas ideas:
Para poder extender las colas (hacia 0 y 1) según lo controlado por un parámetro.
Sin embargo, para que coincida con los valores originales (no transformadas) cerca de la mitad ( 1 / 2 ), lo que hace la transformación más fácil de interpretar.
Para hacer la reexpresión simétrica aproximadamente Es decir, si se reexpresa como , entonces se como .1 / 2.pagsF( p )1 - p- f( p )
Si comienza con cualquier función monótona creciente diferenciable en 1 / 2 se puede ajustar para cumplir con los criterios segundo y tercero: acaba de definirsol: ( 0 , 1 ) → R1 / 2
F( p ) = g( p ) - g( 1 - p )2 g′( 1 / 2 ).
El numerador es explícitamente simétrico (criterio ( 3 ) ), porque intercambiar pags con 1 - p invierte la resta, por lo tanto, la niega. Para ver que ( 2 ) se cumple, nota que el denominador es precisamente el factor necesario para hacer F′(1/2)=1. Recordemos que la aproxima derivados del comportamiento local de una función con una función lineal; una pendiente de 1=1:1 significa que f(p)≈p(más una constante −1/2 ) cuando p está suficientemente cerca de 1/2. Este es el sentido en el que los valores originales se "combinan cerca de la media".
Tukey llama a esto la versión "doblada" de g . Su familia consiste en las transformaciones de potencia y log g(p)=pλ donde, cuando λ=0 , consideramos g(p)=log(p) .
Veamos algunos ejemplos. Cuando λ = 1 / 2 obtenemos la raíz plegada, o "Froot," f(p)=1/2−−−√(p–√−1−p−−−−√). Cuandoλ=0tenemos el logaritmo plegado, o "flog",f(p)=(log(p)−log( 1 - p ) ) / 4. Evidentemente, esto es solo un múltiplo constante de latransformaciónlogit,Iniciar sesión( p1 - p).
En este gráfico corresponde la línea azul para λ = 1 , la línea roja intermedia a λ = 1 / 2 , y la línea verde extrema a λ = 0 . La línea de oro punteada es la transformación del arcoseno, arcsin( 2 p - 1 ) / 2 = arcosin( p-√) - arcsin( 1 / 2---√). El "juego" de las pistas (criterio( 2 )) hace que todos los gráficos para coincidir cerca dep = 1 / 2.
Los valores más útiles del parámetro λ encuentran entre 1 y 0 0 . (Usted puede hacer las colas aún más pesado con valores negativos de λ , pero este uso es poco frecuente.) λ = 1 no hacer nada en absoluto, excepto recenter los valores ( F( P ) = p - 1 / 2 ). Como λ se contrae hacia cero, las colas consiguen tirados más hacia ± ∞ . Esto satisface el criterio n. ° 1. Por lo tanto, al elegir un valor apropiado de λ , puede controlar la "fuerza" de esta reexpresión en las colas.