Considere un vector de parámetros , con θ 1 el parámetro de interés y θ 2 un parámetro molesto.
Si es la probabilidad construido a partir de los datos x , la probabilidad de perfil para θ 1 se define como L P ( θ 1 ; x ) = L ( θ 1 , θ 2 ( θ 1 ) ; x ) donde θ 2 ( θ 1 ) es el MLE de θ 2para un valor fijo de .
Maximizar la probabilidad de perfil con respecto a theta 1 conduce a misma estimación theta 1 como la obtenida mediante la maximización de la probabilidad al mismo tiempo con respecto a theta 1 y theta 2 .
Creo que la desviación estándar de θ 1 también puede estimarse a partir de la segunda derivada de la probabilidad de perfil.
La estadística de probabilidad para H 0 : θ 1 = θ 0 se puede escribir en términos de perfil de verosimilitud: L R = 2 log ( L P ( θ 1 ; x ).
Entonces, parece que la probabilidad de perfil se puede usar exactamente como si fuera una probabilidad real. ¿Es realmente el caso? ¿Cuáles son los principales inconvenientes de ese enfoque? ¿Y qué hay del "rumor" de que el estimador obtenido de la probabilidad del perfil está sesgado (editar: incluso asintóticamente)?