Considere el modelo lineal simple:
donde y , y contiene una columna de constantes.
Mi pregunta es, dado , y , ¿hay una fórmula para un límite superior no trivial en *? (suponiendo que el modelo fue estimado por OLS).
* Supuse, escribiendo esto, que obtener sí mismo no sería posible.
EDITAR1
usando la solución derivada de Stéphane Laurent (ver abajo) podemos obtener un límite superior no trivial en . Algunas simulaciones numéricas (a continuación) muestran que este límite es bastante estricto.
Stéphane Laurent dedujo lo siguiente: donde es una distribución Beta no central con parámetro de no centralidad con
Entonces
donde es un no central χ 2 con el parámetro λ y k grados de libertad. Entonces, un límite superior no trivial para E ( R 2 ) es
es muy ajustado (mucho más apretado de lo que esperaba que fuera posible):
por ejemplo, usando:
rho<-0.75
p<-10
n<-25*p
Su<-matrix(rho,p-1,p-1)
diag(Su)<-1
su<-1
set.seed(123)
bet<-runif(p)
la media de sobre 1000 simulaciones es . El límite superior teórico anterior da . El límite parece ser igualmente preciso en muchos valores de R0.960819
0.9609081
. Realmente asombroso!
EDIT2:
Después de más investigaciones, parece que la calidad de la aproximación del límite superior a mejorará a medida que aumente λ + p (y todo lo demás igual, λ aumenta con n ).