Considere una variable aleatoria de Bernoulli con parámetro (probabilidad de éxito). La función de probabilidad y la información de Fisher (una matriz ) son:θ 1 × 1
Ahora considere una versión "sobre-parametrizada" con dos parámetros: la probabilidad de éxito y la probabilidad de falla . (Tenga en cuenta que , y esta restricción implica que uno de los parámetros es redundante). En este caso, la función de probabilidad y la matriz de información de Fisher (FIM) son:
Observe que los determinantes de estos dos FIM son idénticos. Además, esta propiedad se extiende al caso más general de modelos categóricos (es decir, más de dos estados). También parece extenderse a modelos log-lineales con varios subconjuntos de parámetros restringidos a cero; en este caso, el parámetro "redundante" adicional corresponde a la función de partición logarítmica, y la equivalencia de los dos determinantes de FIM puede mostrarse en función del complemento de Schur de la FIM más grande. (En realidad, para los modelos log-lineales, la FIM más pequeña es solo el complemento de Schur de la FIM más grande).
¿Alguien puede explicar si esta propiedad se extiende a un conjunto más grande de modelos paramétricos (por ejemplo, a todas las familias exponenciales), lo que permite la opción de derivar los determinantes FIM en función de un conjunto de parámetros "extendido"? Supongo que cualquier modelo estadístico dado con parámetros que se encuentran en una variedad dimensional incrustada en un espacio -dimensional. Ahora, si ampliamos el conjunto de parámetros para incluir una dimensión más (que está totalmente restringida en función de las otras) y calculamos los parámetros basados en FIM , siempre obtendremos el mismo determinante que el basado en el original parámetros (independientes)? Además, ¿cómo se relacionan estos dos FIM?
La razón por la que hago esta pregunta es que la FIM con el parámetro adicional a menudo parece más simple. Mi primer pensamiento es que esto no debería funcionar en general. La FIM implica calcular derivadas parciales de la probabilidad de registro de cada parámetro. Estas derivadas parciales suponen que, mientras el parámetro en cuestión cambia, todos los demás parámetros permanecen constantes, lo que no es cierto una vez que involucramos el parámetro adicional (restringido). En este caso, me parece que las derivadas parciales ya no son válidas porque no podemos asumir que los otros parámetros son constantes; Sin embargo, aún no he encontrado evidencia de que esto sea realmente un problema. (Si las derivadas parciales son problemáticas en casos con parámetros dependientes, son derivadas totalesnecesario en su lugar? Todavía no he visto un ejemplo de cálculo de la FIM con derivados totales, pero tal vez esa sea la solución ...)
El único ejemplo que pude encontrar en línea que computa el FIM basado en un conjunto de parámetros "extendido" es el siguiente: estas notas contienen un ejemplo para la distribución categórica, calculando las derivadas parciales requeridas como de costumbre (es decir, como si cada parámetro fuera independiente , a pesar de que hay una restricción entre los parámetros).