¿Cuáles son los mejores métodos para ajustar el 'modo' de datos muestreados de una distribución continua?
Dado que el modo es técnicamente indefinido (¿verdad?) Para una distribución continua, realmente pregunto '¿cómo encuentras el valor más común'?
Si asume que la distribución principal es gaussiana, podría agrupar los datos y encontrar que el modo es la ubicación del contenedor con los mayores recuentos. Sin embargo, ¿cómo se determina el tamaño del contenedor? ¿Hay implementaciones robustas disponibles? (es decir, robusto a los valores atípicos). Uso python
/ scipy
/ numpy
, pero probablemente pueda traducir R
sin demasiada dificultad.