¿Una transformación para cambiar la inclinación sin afectar la curtosis?


11

Tengo curiosidad por saber si hay una transformación que altera el sesgo de una variable aleatoria sin afectar la curtosis. Esto sería análogo a cómo una transformación afín de un RV afecta la media y la varianza, pero no la inclinación y la curtosis (en parte porque la inclinación y la curtosis se definen como invariantes a los cambios de escala). ¿Es este un problema conocido?


¿Requiere que la desviación estándar permanezca constante con esta transformación también?
russellpierce

no, espero que no lo haga, pero el exceso de curtosis debe permanecer fijo. Sin embargo, esperaría que la transformación fuera monotónica y preferiblemente determinista.
shabbychef

1
Yikes: ¡ay de la persona que quiere demostrar que una función no determinista es monótona!
russellpierce

Respuestas:


6

Mi respuesta es el comienzo de un hack total, pero no conozco ninguna forma establecida de hacer lo que pides.

Mi primer paso sería ordenar por orden su conjunto de datos; puede encontrar la posición proporcional en su conjunto de datos y luego transformarlo en una distribución normal; este método se utilizó en Reynolds y Hewitt, 1996. Vea el código R de muestra a continuación en PROCMiracle.

Una vez que la distribución es normal, el problema se ha vuelto loco: una cuestión de ajustar la curtosis pero no sesgarla. Una búsqueda en Google sugirió que uno podría seguir los procedimientos de John & Draper, 1980 para ajustar la curtosis pero no la asimetría, pero no pude replicar ese resultado.

Mis intentos de desarrollar una función cruda de expansión / estrechamiento que toma el valor de entrada (normalizado) y agrega o resta un valor proporcional a la posición de la variable en la escala normal resulta en un ajuste monótono, pero en la práctica tiende a crear una distribución bimodal a través de una que tiene los valores deseados de asimetría y curtosis.

Me doy cuenta de que esta no es una respuesta completa, pero pensé que podría proporcionar un paso en la dirección correcta.

PROCMiracle <- function(datasource,normalrank="BLOM")
  {
     switch(normalrank,
      "BLOM" = {
                  rmod <- -3/8
                  nmod <- 1/4
                },
      "TUKEY" = {
                  rmod <- -1/3
                  nmod <- 1/3
                },
      "VW" ={
                  rmod <- 0
                  nmod <- 1
            },
      "NONE" = {
                  rmod <- 0
                  nmod <- 0
                }
    )
    print("This may be doing something strange with NA values!  Beware!")
    return(scale(qnorm((rank(datasource)+rmod)/(length(datasource)+nmod))))
  }

Había estado haciendo algo como esto: clasificar, luego usar la transformación g y h para obtener una curtosis fija y sesgar. Sin embargo, esta técnica supone que realmente conozco la curtosis de la población, lo que puedo estimar, pero me interesa, filosóficamente, si hay una transformación que preserva la curtosis sin que yo tenga que saber qué es ...
shabbychef

@shabbychef: Oh, bueno, perdón por no agregar nada nuevo. Sin embargo, agregaste algo nuevo, no había oído hablar de la fórmula G y H antes. ¿Tiene una cita de libre acceso que lo proporciona? Me topé con un papel en el que estaba escrito ( fic.wharton.upenn.edu/fic/papers/02/0225.pdf ) pero la idea es un poco extraña para mí (en particular es que e ^ Z ^ g u otra cosa )? Lo intenté así ... pero los resultados parecían extraños ... a + b * (e ^ g ^ z-1) * (exp ((h * z ^ 2) / 2) / g).
russellpierce

1
@drnexus: no quería sesgar los resultados al mencionar mi técnica. Aprendí sobre las distribuciones g-and-h y g-and-k de Haynes et. al, dx.doi.org/10.1016/S0378-3758(97)00050-5 , y Fisher & Klein, econstor.eu/bitstream/10419/29578/1/614055873.pdf
shabbychef

1

nn12norma entre las estadísticas de orden de muestra y la versión transformada sujeta a las restricciones dadas. Sin embargo, este es un tipo de enfoque loco. En la pregunta original, estaba buscando algo más básico y fundamental. También estaba buscando implícitamente una técnica que pudiera aplicarse a observaciones individuales, independientemente de tener una cohorte completa de muestras.


0

Prefiero modelar este conjunto de datos usando una distribución leptokurtic en lugar de usar transformaciones de datos. Me gusta la distribución sinh-arcsinh de Jones y Pewsey (2009), Biometrika.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.