Estoy tratando de separar dos grupos de valores de un solo conjunto de datos. Puedo suponer que una de las poblaciones está normalmente distribuida y tiene al menos la mitad del tamaño de la muestra. Los valores del segundo son más bajos o más altos que los valores del primero (se desconoce la distribución). Lo que intento hacer es encontrar los límites superior e inferior que encerrarían a la población normalmente distribuida de la otra.
Mi suposición me proporciona un punto de partida:
- Todos los puntos dentro del rango intercuartil de la muestra son de la población normalmente distribuida.
Estoy tratando de detectar valores atípicos tomándolos del resto de la muestra hasta que no encajen en el 3 st.dev de la población normalmente distribuida. Lo cual no es ideal, pero parece producir un resultado lo suficientemente razonable.
¿Mi suposición es estadísticamente sólida? ¿Cuál sería una mejor manera de hacer esto?
PD: arregla las etiquetas a alguien.