Estoy tratando de probar la nula , contra la alternativa local , para una variable aleatoria , sujeta a sesgo leve y medio y curtosis de la variable aleatoria. Siguiendo las sugerencias de Wilcox en 'Introducción a la estimación robusta y las pruebas de hipótesis', he examinado las pruebas basadas en la media recortada, la mediana, así como el estimador M de ubicación (procedimiento de "un paso" de Wilcox). Estas pruebas robustas superan a la prueba t estándar, en términos de potencia, cuando se realizan pruebas con una distribución no sesgada, pero leptokurtótica.
Sin embargo, cuando se realiza una prueba con una distribución sesgada, estas pruebas unilaterales son demasiado liberales o demasiado conservadoras según la hipótesis nula, dependiendo de si la distribución está sesgada hacia la izquierda o hacia la derecha, respectivamente. Por ejemplo, con 1000 observaciones, la prueba basada en la mediana realmente rechazará ~ 40% del tiempo, al nivel nominal de 5%. La razón de esto es obvia: para distribuciones sesgadas, la mediana y la media son bastante diferentes. Sin embargo, en mi solicitud, realmente necesito probar la media, no la mediana, no la media recortada.
¿Existe una versión más robusta de la prueba t que realmente evalúa la media, pero es impermeable al sesgo y la curtosis?
Idealmente, el procedimiento también funcionaría bien en el caso sin sesgo y de alta curtosis. La prueba de 'un paso' es casi lo suficientemente buena, con el parámetro de 'flexión' establecido relativamente alto, pero es menos potente que las pruebas medias recortadas cuando no hay sesgo, y tiene algunos problemas para mantener el nivel nominal de rechazos bajo sesgo .
Antecedentes: la razón por la que realmente me importa la media, y no la mediana, es que la prueba se usaría en una aplicación financiera. Por ejemplo, si quisiera probar si una cartera tenía retornos log esperados positivos, la media es realmente apropiada porque si invierte en la cartera, experimentará todos los retornos (que es la media multiplicada por el número de muestras), en lugar de duplicados de la mediana. Es decir, lo que realmente importa la suma de se basa en la RV .