Publiqué esto en mathoverflow y nadie respondió:
El método de Scheffé para identificar contrastes estadísticamente significativos es ampliamente conocido. Un contraste entre las medias , de poblaciones es una combinación lineal en la que , y un múltiplo escalar de un contraste es esencialmente el mismo contraste, por lo que se podría decir que el conjunto de contrastes es un espacio proyectivo. El método de Scheffé prueba una hipótesis nula que dice que todos los contrastes entre estas poblaciones son , y dado un nivel de significancia , rechaza la hipótesis nula con probabilidad i = 1 , … , r r ∑ r i = 1 c i μ i ∑ r i = 1 c i = 00 α αdado que la hipótesis nula es cierta. Y si se rechaza la hipótesis nula, Scheffé señala que su prueba nos dice qué contrastes difieren significativamente de (no estoy seguro de que el artículo de Wikipedia que vinculé señala eso).
Me gustaría saber si se puede hacer algo similar en un tipo diferente de situación. Considere un modelo de regresión lineal simple , donde , .ε i ∼ i . yo . d . N ( 0 , σ 2 ) i = 1 , … , n
La hipótesis nula que quiero considerar se refiere a un tipo diferente de contraste. Dice que no hay un subconjunto tal que para y para , donde . Si el subconjunto se especifica de antemano, entonces una prueba normal de dos muestras lo hace, pero queremos algo que considere todos los subconjuntos y mantenga baja la probabilidad de rechazar una hipótesis nula verdadera.E ( Y i ) = α 1 + β x i i ∈ A E ( Y i ) = α 2 + β x i i ∉ A α 1 ≠ α 2 A t
Uno podría resolver esto si la eficiencia no fuera una preocupación: encuentre una prueba que pase por todas las posibilidades . Incluso entonces es problemático; Dos contrastes no serían independientes. Le pregunté a un experto en detección de valores atípicos sobre esto y él simplemente dijo que es una pesadilla combinatoria. Luego pregunté si se podía probar que no hay una manera eficiente de hacerlo, tal vez reduciendo un problema NP-difícil. Simplemente dijo que se mantiene alejado de los problemas NP-difíciles.
Entonces: ¿se puede probar que este problema es "difícil" o que no lo es?