La razón por la cual el núcleo Epanechnikov no se usa universalmente por su óptima teórica puede ser que el núcleo Epanechnikov no sea teóricamente óptimo . Tsybakov critica explícitamente el argumento de que el núcleo Epanechnikov es "teóricamente óptimo" en las páginas 16-19 de Introducción a la estimación no paramétrica (sección 1.2.4).
Tratando de resumir, bajo algunos supuestos en el núcleo K y una densidad fija p uno tiene que el error cuadrado integrado medio es, de la forma
1nh∫K2(u)du+h44S2K∫(p′′(x))2dx.(1)
La principal crítica de Tsybakov parece estar minimizando los núcleos no negativos, ya que a menudo es posible obtener estimadores de mejor rendimiento, que incluso son no negativos, sin restringirlos a núcleos no negativos.
El primer paso del argumento para el núcleo Epanechnikov comienza minimizando (1) sobre h y todos los núcleos no negativos (en lugar de todos los núcleos de una clase más amplia) para obtener un ancho de banda "óptimo" para K
hMISE(K)=(∫K2nS2K∫(p′′)2)1/5
y el núcleo "óptimo" (Epanechnikov)
K∗(u)=34(1−u2)+
cuyo error cuadrado medio integrado es:
hMISE(K∗)=(15n∫(p′′)2)1/5.
Sin embargo, estas no son opciones viables, ya que dependen del conocimiento (a través de p′′ ) de la densidad desconocida p , por lo tanto, son cantidades "oráculo".
Una propuesta dada por Tsybakov implica que el MISE asintótico para el oráculo Epanechnikov es:
limn→∞n4/5Ep∫(pEn(x)−p(x))2dx=34/551/54(∫(p′′(x))2dx)1/5.(2)
Tsybakov dice que (2) a menudo se afirma que es el mejor MISE alcanzable, pero luego muestra que uno puede usar núcleos de orden 2 (para lo cual SK=0 ) para construir estimadores de núcleo, para cadaε>0 , de modo que
lim supn→∞n4/5Ep∫(p^n(x)−p(x))2dx≤ε.
A pesar de que p n no es necesariamente no negativa, uno todavía tiene el mismo resultado para el estimador positivo parte, p + n : = max ( 0 , p n ) (que se garantiza que sea no negativo incluso si K no es):p^np+n:=max(0,p^n)K
lim supn→∞n4/5Ep∫(p+n(x)−p(x))2dx≤ε.
Por lo tanto, para ε suficientemente pequeño, existen estimadores verdaderos que tienen un MISE asintótico más pequeño que el oráculo de Epanechnikov , incluso utilizando los mismos supuestos en la densidad desconocida p .
En particular, uno tiene como resultado que el mínimo del MISE asintótico para una p fija sobre todos los estimadores del núcleo (o partes positivas de los estimadores del núcleo) es 0 . Por lo tanto, el oráculo de Epanechnikov ni siquiera está cerca de ser óptimo, incluso en comparación con los estimadores verdaderos.
La razón por la cual las personas presentaron el argumento a favor del oráculo de Epanechnikov en primer lugar es que a menudo se argumenta que el núcleo en sí mismo no debería ser negativo porque la densidad en sí misma no es negativa. Pero como señala Tsybakov, uno no tiene que suponer que el núcleo no es negativo para obtener estimadores de densidad no negativos, y al permitir otros núcleos se pueden estimadores de densidad no negativos que (1) no son oráculos y (2) funcionan arbitrariamente mejor que el oráculo de Epanechnikov para una p fija . Tsybakov usa esta discrepancia para argumentar que no tiene sentido argumentar a favor de la optimización en términos de una p fija , sino solo para las propiedades de optimización que son uniformes sobre una clasede densidades. También señala que el argumento todavía funciona cuando se usa MSE en lugar de MISE.
EDITAR: Ver también Corolario 1.1. en la p.25, donde se muestra que el núcleo Epanechnikov es inadmisible según otro criterio. A Tsybakov realmente parece no gustarle el núcleo Epanechnikov.
kdensity
.