La respuesta anterior es correcta. Como referencia, aquí hay un código R de trabajo elaborado para calcularlo. Me he tomado la libertad de agregar una intercepción, porque probablemente quieras una de esas.
## make some data
set.seed(1234)
N <- 2000
x1 <- rnorm(N)
x2 <- rnorm(N)
## create linear predictor
lpred <- 0.5 + 0.5 * x1 + 0.25 * x2
## apply inverse link function
ey <- 1/(1 + exp(-lpred))
## sample some dependent variable
y <- rbinom(N, prob=ey, size=rep(1,N))
dat <- matrix(c(x1, x2, y), nrow=N, ncol=3)
colnames(dat) <- c('x1', 'x2', 'y')
Ahora construya una función de probabilidad de registro para maximizar, usando aquí dbinom
porque está allí y sumando los resultados
## the log likelihood function
log.like <- function(beta, dat){
lpred <- beta[1] + dat[,'x1'] * beta[2] + dat[,'x2'] * beta[2]**2
ey <- 1/(1 + exp(-lpred))
sum(dbinom(dat[,'y'], prob=ey, size=rep(1,nrow(dat)), log=TRUE))
}
y ajustar el modelo por la máxima probabilidad. No me he molestado en ofrecer un gradiente o elegir un método de optimización, pero es posible que desee hacer ambas cosas.
## fit
res <- optim(par=c(1,1), ## starting values
fn=log.like,
control=list(fnscale=-1), ## maximise not minimise
hessian=TRUE, ## for SEs
dat=dat)
Ahora eche un vistazo a los resultados. Las estimaciones del parámetro ML y los SE asintóticos son:
## results
data.frame(coef=res$par,
SE=sqrt(diag(solve(-res$hessian))))
cual debería ser
## coef SE
## 1 0.4731680 0.04828779
## 2 0.5799311 0.03363505
o hay un error (que siempre es posible).
Se aplican las advertencias habituales sobre los errores estándar derivados de Hesse.