A continuación se muestra un histograma de algunos datos, los contenedores son enteros y los otros parámetros son irrelevantes.
Como puede ver, parece haber dos distribuciones normales separadas pero superpuestas para números pares e impares.
La probabilidad de ser un número par es 1/3, del mismo modo 2/3 para un número impar.
No tengo idea de la significación estadística real de esto para ser honesto, así que estoy tratando de averiguar qué es aprender más, pero no puedo encontrar nada, he intentado tantos términos de búsqueda para encontrar esto e incluso búsquedas de imágenes inversas, pero todo lo que obtengo es información sobre distribuciones multimodales, etc. y no puedo encontrar nada sobre cuándo las distribuciones multimodales se superponen de esta manera
¿Hay un nombre para esto?
Para aquellos interesados, los datos provienen de 1,000,000 juegos aleatorios de goofspiel (N = 13) usando el script matlab
N = 1000000;
random = zeros(1,N);
for i = 1 : N
pc = randperm(13);
p1 = randperm(13);
p2 = randperm(13);
random(i) = sum(pc.*sign(p1-p2));
end
histogram(random,'BinMethod','integer')
Un ejemplo más general (aunque artificial) sería el siguiente
a = [1:50 50:-1:1];
b = normpdf(linspace(-2,2),0,0.5).*50;
c = a;
rng('default') %For reproducibility
d = logical(randi([0,1],1,length(a)));
for i = 1:length(c) %There's gotta be a way to do this without an explicit loop
if(d(i))
c(i) = b(i);
end
end
bar(c)
Al igual que el primer ejemplo, hay dos distribuciones superpuestas (triangular y normal), pero en este caso en lugar de alternar en cada punto, es aleatorio.
Sé que este es un ejemplo exagerado (y ni siquiera un histograma) pero tiene que haber ejemplos de este tipo de cosas que realmente suceden con los datos estadísticos, ¿verdad? Por otra parte, tal vez no, ¿o es completamente irrelevante?
La pregunta real es doble:
la pregunta general: ¿cómo se llama este tipo de "cosa", si acaso? - para que yo (o cualquier otra persona que pueda encontrarlo) pueda obtener más información al respecto y si es necesario realizar algún ajuste.
La pregunta, ya que se relaciona específicamente con mi primer conjunto de datos, ¿ debería separar los valores pares e impares o ajustar una distribución normal a todo el conjunto?