Esta pregunta está motivada por esta . Busqué dos fuentes y esto es lo que encontré.
A. van der Vaart, Estadísticas asintóticas:
Rara vez es posible calcular explícitamente la probabilidad de un perfil, pero su evaluación numérica a menudo es factible. Entonces, la probabilidad de perfil puede servir para reducir la dimensión de la función de probabilidad. Las funciones de probabilidad de perfil a menudo se usan de la misma manera que las funciones de probabilidad (ordinarias) de los modelos paramétricos. Aparte de tomar sus puntos de máxima como estimadores theta , la segunda derivada en θ se utiliza como una estimación de menos la inversa de la matriz de covarianza asintótica de e. Investigaciones recientes parecen validar esta práctica.
J. Wooldridge, Análisis econométrico de sección transversal y datos de panel (lo mismo en ambas ediciones):
Como dispositivo para estudiar las propiedades asintóticas, la función objetivo concentrada es de valor limitado porque
Wooldridge analiza el problema en un contexto más amplio de estimadores M, por lo que también se aplica a los estimadores de máxima verosimilitud.
Entonces obtenemos dos respuestas diferentes para la misma pregunta. El diablo en mi opinión está en los detalles. Para algunos modelos, podemos usar la probabilidad de hessian de perfil de forma segura para algunos modelos que no lo son. ¿Hay resultados generales que den condiciones cuando podemos hacer eso (o no podemos)?