¿Cómo derivar la función de probabilidad de distribución binomial para la estimación de parámetros?

22

Según Miller and Freund's Probability and Statistics for Engineers, 8ed (pp.217-218), la función de probabilidad de maximizar la distribución binomial (ensayos de Bernoulli) se da como

$L(p) = \prod_{i=1}^np^{x_i}(1-p)^{1-x_i}$

¿Cómo llegar a esta ecuación? Me parece bastante claro con respecto a las otras distribuciones, Poisson y Gaussian;

$L(\theta) = \prod_{i=1}^n \text{PDF or PMF of dist.}$

Pero el del binomio es solo un poco diferente. Para ser directo, ¿cómo

$nC_x~p^x(1-p)^{n-x}$

volverse

$p^{x_i}(1-p)^{1-x_i}$

en la función de probabilidad anterior?

— Ébe Isaac
fuente

25

En la estimación de máxima verosimilitud, está intentando maximizar ; sin embargo, maximizar esto es equivalente a maximizar para una fija . $nC_x~p^x(1-p)^{n-x}$ $p^x(1-p)^{n-x}$ $x$

En realidad, la probabilidad de que gaussiano y poisson tampoco impliquen sus constantes principales, por lo que este caso es como el de w

Direccionamiento OPs Comentario

Aquí hay un poco más de detalle:

Primero, es el número total de éxitos, mientras que es una única prueba (0 o 1). Por lo tanto: $x$ $x_i$

\prod_{yo = 1}^{norte} {pags}^{X_{yo}} (1 - pags)^{1 - X_{yo}} = {pags}^{\sum_{1}^{norte} X_{yo}} (1 - pags)^{\sum_{1}^{norte} 1 - X_{yo}} = {pags}^{X} (1 - pags)^{norte - X}

$\prod_{i=1}^np^{x_i}(1-p)^{1-x_i} = p^{\sum_1^n x_i}(1-p)^{\sum_1^n1-x_i} = p^{x}(1-p)^{n-x}$

Eso muestra cómo obtienes los factores de probabilidad (ejecutando los pasos anteriores al revés).

¿Por qué desaparece la constante? Informalmente, y lo que hace la mayoría de las personas (incluyéndome a mí), es solo notar que la constante principal no afecta el valor de que maximiza la probabilidad, por lo que simplemente lo ignoramos (efectivamente lo establecemos en 1). $p$

Podemos derivar esto tomando el registro de la función de probabilidad y encontrando dónde su derivada es cero:

En (norte {do}_{X} {pags}^{X} (1 - pags)^{norte - X}) = En (norte {do}_{X}) + X En (pags) + (norte - X) En (1 - pags)

$\ln\left(nC_x~p^x(1-p)^{n-x}\right) = \ln(nC_x)+x\ln(p)+(n-x)\ln(1-p)$

$p$ $0$

\frac{re}{re pags} En (norte {do}_{X}) + X En (pags) + (norte - X) En (1 - pags) = \frac{X}{pags} - \frac{norte - X}{1 - pags} = 0 0

$\frac{d}{dp}\ln(nC_x)+x\ln(p)+(n-x)\ln(1-p) = \frac{x}{p}- \frac{n-x}{1-p} = 0$

⟹ \frac{norte}{X} = \frac{1}{pags} ⟹ pags = \frac{X}{norte}

$\implies \frac{n}{x} = \frac{1}{p} \implies p = \frac{x}{n}$

Observe que la constante inicial se retiró del cálculo de la MLE.

$L_1,L_2$ $L_1=kL_2$ $p$

A nivel práctico, la inferencia que usa la función de probabilidad se basa realmente en la razón de probabilidad, no en el valor absoluto de la probabilidad. Esto se debe a la teoría asintótica de las razones de probabilidad (que son asintóticamente chi-cuadrado, sujetas a ciertas condiciones de regularidad que a menudo son apropiadas). Las pruebas de razón de probabilidad se ven favorecidas debido al Lema de Neyman-Pearson . Por lo tanto, cuando intentamos probar dos hipótesis simples, tomaremos la relación y el factor principal común se cancelará.

NOTA: Esto no sucederá si estuviera comparando dos modelos diferentes, digamos un binomio y un poisson. En ese caso, las constantes son importantes.

De las razones anteriores, la primera (irrelevancia para encontrar el maximizador de L) responde más directamente a su pregunta.

2

n C_{x}

$nC_x$

n

$n$

@ ÉbeIsaac agregó algunos detalles más

2

xi en el producto se refiere a cada prueba individual. Para cada prueba individual, xi puede ser 0 o 1 yn es igual a 1 siempre. Por lo tanto, trivialmente, el coeficiente binomial será igual a 1. Por lo tanto, en la fórmula del producto para la probabilidad, el producto de los coeficientes binomiales será 1 y, por lo tanto, no hay nCx en la fórmula. Me di cuenta de esto mientras lo trabajaba paso a paso :) (Perdón por el formato, no estoy acostumbrado a responder con expresiones matemáticas en las respuestas ... todavía :))

— Abhishek Tiwari
fuente