¿Hay alguna razón particular por la que elegirás la estimación de densidad del kernel sobre la estimación paramétrica? Estaba aprendiendo a ajustar la distribución a mis datos. Esta pregunta me vino.
Mi tamaño de datos es relativamente grande con 7500 puntos de datos. Auto reclamaciones. Mi objetivo es ajustarlo a una distribución (no paramétrica o paramétrica). Y luego úselo para simular datos de reclamo automático y calcule VaR o TVaR.
Utilicé log para transformar los datos para que sean relativamente normales. Ajusté muchas distribuciones, incluyendo normal, lognormal, gamma, t, etc. Utilicé AIC y loglikehood para identificar el mejor ajuste. Pero ninguno de estos ajustes pasó la prueba KS (valor p extremadamente pequeño, con e-10).
Es por eso que pregunté en qué situación debería cambiar a KDE.