Pregunta: Con una cadena MCMC de 10 dimensiones, digamos que estoy preparado para entregarle una matriz de los sorteos: 100,000 iteraciones (filas) por 10 parámetros (columnas), ¿cómo puedo identificar los modos posteriores? Me preocupan especialmente los modos múltiples.
Antecedentes:Me considero un experto en informática, pero cuando un colega me hizo esta pregunta, me avergoncé de no poder encontrar una respuesta razonable. La principal preocupación es que pueden aparecer modos múltiples, pero solo si se consideran al menos ocho de las diez dimensiones. Mi primer pensamiento sería usar una estimación de la densidad del núcleo, pero una búsqueda en R no reveló nada prometedor para problemas de más de tres dimensiones. El colega ha propuesto una estrategia de agrupamiento ad-hoc en diez dimensiones y buscando un máximo, pero mi preocupación es que el ancho de banda puede conducir a problemas de escasez significativos o a una falta de resolución para discernir modos múltiples. Dicho esto, con mucho gusto acepto sugerencias para sugerencias automatizadas de ancho de banda, enlaces a un estimador de densidad de 10 núcleos o cualquier otra cosa que conozca.
Preocupaciones
Creemos que la distribución puede ser bastante sesgada; por lo tanto, deseamos identificar los modos posteriores y no los medios posteriores.
Nos preocupa que pueda haber varios modos posteriores.
Si es posible, preferiríamos una sugerencia basada en R. Pero cualquier algoritmo funcionará siempre que no sea increíblemente difícil de implementar. Supongo que preferiría no implementar un estimador de densidad de kernel Nd con selección automática de ancho de banda desde cero.