Como se ha señalado, las expectativas simplemente se suman.
Sin embargo, sabiendo que la expectativa no es muy útil, también necesita tener una idea de la posible variación a su alrededor.
Hay tres cosas por las que debe preocuparse:
variación en los individuos en torno a sus expectativas (una persona con un 60% de posibilidades de venir en realidad no logra sus expectativas; siempre están por encima o por debajo de ellas)
dependencia entre personas. Las parejas que podrían venir ambas tenderán a asistir a ambas o a ninguna. Los niños pequeños no asistirán sin sus padres. En algunos casos, algunas personas pueden evitar venir si saben que otra persona estará allí.
error en la estimación de las probabilidades. Esas probabilidades son solo conjeturas; es posible que desee considerar el efecto de conjeturas algo diferentes (tal vez las evaluaciones de alguien de esos números)
El primero es susceptible de cálculo, ya sea por aproximación normal o por simulación. El segundo podría simularse bajo varios supuestos, ya sea específicos para las personas, o considerando alguna distribución de dependencias. (El tercer elemento es más difícil).
Editado para abordar las preguntas de seguimiento en los comentarios:
Si entiendo bien tu fraseo, para la familia de 4, tienes un 50% de posibilidades de que vengan 4 personas o ninguna. Es un número esperado de 2, sin duda, pero también querrás tener una idea de la variabilidad en torno a las expectativas, en cuyo caso probablemente quieras mantener la situación real del 50% de 0/50% de 4.
Si puede dividir a todos en grupos independientes, una buena primera aproximación (con muchos de esos grupos) sería agregar las medias y las variaciones entre los grupos independientes y luego tratar la suma como normal (quizás con corrección de continuidad). Un enfoque más preciso sería simular el proceso o calcular la distribución exactamente mediante convolución numérica; Si bien ambos enfoques son sencillos, este es un nivel innecesario de precisión para esta aplicación en particular, ya que hay tantas capas de aproximación: es como saber las dimensiones de una habitación al pie más cercano y luego calcular cuánta pintura necesitará al mililitro más cercano: la precisión adicional no tiene sentido.
Así que imagine (por simplicidad) que teníamos cuatro grupos:
1) grupo A (1 individual) - 70% de probabilidad de asistencia
2) grupo B (1 individual) - 60% de posibilidades de asistencia
3) grupo C (familia de 4) - 0: 0.5 4: 0.5 (si alguien se queda en casa, ninguno vendrá)
4) grupo D (par de 2) - 0: 0.4 1: 0.1 2: 0.5 (es decir, 50% de posibilidades de ambos, más 10% de posibilidades de que exactamente uno venga, por ejemplo, si el otro tiene compromisos de trabajo o está enfermo)
Luego obtenemos los siguientes medios y variaciones:
mean variance
A 0.7 0.21
B 0.6 0.24
C 2.0 4.0
D 1.1 0.89
Tot 4.4 5.34
Entonces, una aproximación normal será bastante aproximada en este caso, pero sugeriría que más de 7 personas serían bastante improbables (del orden del 5%), y 6 o menos ocurrirían aproximadamente del 75 al 80% de las veces.
[Un enfoque más preciso sería simular el proceso, pero en el problema completo en lugar del ejemplo reducido esto probablemente sea innecesario ya que ya hay muchas capas de aproximación].
Una vez que tenga su distribución combinada que incorpore tales dependencias grupales, es posible que desee aplicar cualquier fuente de dependencia conjunta general (como el clima severo), o simplemente puede asegurarse o incluso ignorar tales eventualidades, dependiendo de las circunstancias .