Dado que hoy es un día bisiesto, ¿alguien sabe la probabilidad de nacer en un día bisiesto?
Dado que hoy es un día bisiesto, ¿alguien sabe la probabilidad de nacer en un día bisiesto?
Respuestas:
Seguro. Consulte aquí para obtener una explicación más detallada: http://www.public.iastate.edu/~mlamias/LeapYear.pdf .
Pero esencialmente el autor concluye: "Hay 485 años bisiestos en 2 milenios. Entonces, en 2 milenios, hay días en total. De esos días, el 29 de febrero ocurre en 485 de ellos (los años bisiestos), por lo que la probabilidad es 485 / 730.485 mil = 0,0006639424 "
Para predecir con precisión esa probabilidad utilizando estadísticas, sería útil saber dónde tuvo lugar el nacimiento.
Esta página http://chmullig.com/2012/06/births-by-day-of-year/ tiene un gráfico que muestra un subconjunto del número de nacimientos por día (multiplicando el 29 por 4, lo cual es incorrecto e indeseable para esta pregunta, pero también se vincula a los datos originales y ofrece una indicación aproximada de lo que puede esperar) en los Estados Unidos. Supongo que esta curva no es válida para otros países, y especialmente no para otros continentes. En particular, el hemisferio sur y la región ecuatorial pueden mostrar una derivación sustancial de estos resultados, suponiendo que el clima es un factor determinante.
Además, está el tema del "nacimiento electivo" (mencionado por los autores de http://bmjopen.bmj.com/content/3/8/e002920.full ) - en las regiones más pobres del mundo, esperaría un cambio diferente. distribución de nacimientos, simplemente porque las cesáreas (no de emergencia) o los nacimientos inducidos son más raros que en los países desarrollados. Esto sesga la distribución final de los nacimientos.
Utilizando los datos estadounidenses, suponiendo ~ 71 millones de nacimientos (media graficada aproximada * 366) y 46,000 nacimientos el 29 de febrero, sin corregir la distribución de los años bisiestos en los datos, porque el período preciso no está indicado, llego a una probabilidad de alrededor de ~ 0.000648. Esto está ligeramente por debajo del valor que cabría esperar dada una distribución plana de nacimientos y, por lo tanto, en línea con la impresión general dada por el gráfico.
Dejaré una prueba de importancia de esta estimación aproximada a un lector motivado. Pero dado que el 29 (aunque no corregido, el año 2000 inyecta un sesgo por debajo del promedio en los datos) tiene puntajes bajos incluso para los estándares ya bajos de febrero, supongo una confianza relativamente alta de que la hipótesis nula de distribución equitativa puede ser rechazada.
Creo que la respuesta a esta pregunta solo puede ser empírica. Cualquier respuesta teórica sería errónea sin tener en cuenta los fenómenos de selección de cumpleaños, la estacionalidad, etc. Estas cosas son imposibles de abordar teóricamente.
Los datos de cumpleaños son difíciles de encontrar en los EE. UU. Por razones de privacidad. Hay un conjunto de datos anónimos aquí . Es de solicitudes de seguros en los Estados Unidos. La diferencia con otros informes, como un artículo popular del NYT que se cita con frecuencia , es que enumera la frecuencia de los nacimientos por fecha, en lugar de la simple clasificación de días en un año. El punto débil es, por supuesto, el sesgo de muestreo, ya que proviene del seguro: las personas sin seguro no están incluidas, etc.
Según los datos, el 29 de febrero hubo 325 nacimientos del total de 481040. Según Roy Murphy , la muestra abarca desde 1981 hasta 1994. Incluye 3 años bisiestos de un total de 14 años. Sin ningún ajuste, la probabilidad sería 0.0675% de haber nacido el 29 de febrero entre 1981 y 1994.
Se puede ajustar la probabilidad de que representa la frecuencia de los años bisiestos, que está cerca de 1/4 ( no exactamente, aunque ), por ejemplo, multiplicando este número por para llegar a 0,079% estimado. Aquí, la probabilidad condicional p de nacer el 29 de febrero en un año bisiesto está vinculada a la frecuencia observada F o = 325 por la frecuencia f L = 3 de los años bisiestos en una muestra: F o = f L / N ⋅ F ⋅ p , donde N = 14
Normalmente, la probabilidad de años bisiestos es , por lo tanto, la media a largo plazo de probabilidad P L de haber nacido el 29 de febrero es: P L = p L ⋅ p ≈ p L ⋅ N
Puede que le interese la probabilidad condicional de nacer el 29 de febrero dado que nació en año bisiesto: p = N
Entonces, el vínculo entre y p se basa en algunos supuestos, por ejemplo, que la probabilidad de nacer en un año determinado es uniforme y no cambia.
Por supuesto, esta discusión se centró en los Estados Unidos. Quién sabe cuáles son los patrones en otros países.
ACTUALIZACIÓN: Asumimos automáticamente que OP es un calendario gregoriano. Se vuelve aún más interesante si considera diferentes calendarios como el calendario lunar Hijri , donde los años bisiestos son cada 30 años más o menos.
ACTUALIZACIÓN 2:
Amitabh Chandra, Harvard University
Ahora, ¿qué tan probable es que esos días muy peculiares en el calendario gregoriano: 1 de enero, 25 de diciembre y 29 de diciembre lleguen al azar como los cumpleaños más populares? Digo que es muy poco probable que ocurra al azar. Por lo tanto, es aún más interesante ver lo que está sucediendo en otros calendarios como Hijri.
ACTUALIZACIÓN 3:
ACTUALIZACIÓN 4:
d=[0101 1482
...
1231 1352];
%%
tc = sum(d(:,2)); % total obs
idL = 60; % index of Feb 29
% theor frequency, assuming uniform
ny = 1994 - 1981 + 1; % num of years
nL = 3; % # of leap years: 1984, 1988, 1992
nd = 365*ny + nL; % total # of days
fc = tc/nd; % expected freq for calendar date in sample
td = ones(366,1)*fc*ny; % roll the dates into day of year
td(idL) = fc*nL;
fprintf(1,'non-leap day expected freq: %f\n',td(end))
fprintf(1,'leap day expected freq: %f\n',td(idL))
fprintf(1,'non-leap day average freq: %f\n',mean(d([1:idL-1 idL+1:end],2)))
fprintf(1,'non-leap day freq std dev: %f\n',std(d([1:idL-1 idL+1:end],2)))
fprintf(1,'leap day observed freq: %f\n',d(idL,2))
% plots
bar(d(:,2))
hold on
plot(td,'r')
legend('empirical','theoretical')
title('Distribution of birth dates 1981-1994')
set(gca,'XTick',1:30:366)
set(gca,'XTickLabels',[num2str(floor(d(1:30:366,1)/100)) repmat('/',13,1) num2str(rem(d(1:30:366,1),100))])
grid on
% chi^2 test
[h p]=chi2gof(d(:,2),'Expected',td)
SALIDA:
non-leap day expected freq: 1317.144534
leap day expected freq: 282.245257
non-leap day average freq: 1317.027397
non-leap day freq std dev: 69.960227
leap day observed freq: 325.000000
h =
1
p =
0
La portada de mi libro favorito ofrece alguna evidencia muy relevante contra la suposición de una asignación uniforme de nacimientos a fechas. Específicamente, los nacimientos en los EE. UU. Desde 1970 exhiben varias tendencias superpuestas entre sí: una tendencia larga de varias décadas, una tendencia no periódica, tendencias del día de la semana, tendencias del día del año, tendencias de vacaciones (porque procedimientos como la cesárea la sección le permite a uno programar efectivamente la fecha de nacimiento, y los médicos a menudo no los hacen en días festivos). El resultado es que la probabilidad de nacer en un día elegido al azar en un año no es uniforme, y debido a que la tasa de natalidad varía entre años, tampoco todos los años son igualmente probables.
Esto también proporciona evidencia de que la solución de Asksal, aunque es un contendiente muy fuerte, también es incompleta. Un pequeño número de días bisiestos estará "contaminado" por todos los efectos en juego aquí, por lo que la estimación de Asksal también está capturando (por casualidad) el efecto del día de la semana y las tendencias a largo plazo junto con el 29 de febrero. efecto. Qué efectos son y no son apropiados para incluir no están claramente definidos por su pregunta.
Y este análisis solo tiene relación con los EE. UU., Que tiene tendencias demográficas que podrían ser bastante diferentes de otras naciones o poblaciones. La tasa de natalidad de Japón ha estado disminuyendo durante décadas, por ejemplo. La tasa de natalidad de China está regulada por el estado, con algunas consecuencias para la composición de género de su nación y, por lo tanto, las tasas de natalidad en las generaciones posteriores.
Del mismo modo, el análisis de Gelman solo describe varias décadas recientes, y no está necesariamente claro que esta sea incluso la era de interés para su pregunta.
Para aquellos que se entusiasman con este tipo de cosas, el material de la portada se discute extensamente en el capítulo sobre procesos gaussianos.
El 29 de febrero es una fecha que ocurre cada año que es un múltiplo de 4 .
Sin embargo, los años que son múltiplos de 100 pero no uno de 400, no se consideran años bisiestos (por ejemplo: 1900 no es bisiesto, mientras que 2000 o 1600 sí lo son). Por lo tanto, hoy en día, es el mismo patrón cada 400 años.
Así que hagamos los cálculos en un [0; 400 [ intervalo:
En un período de 400 años, hay exactamente 4 x 25 = 100 años que son múltiplos de 4 . Pero tenemos que restar 3 (años múltiplo de 100 pero no de 400) de 100, y obtenemos 100 - 3 = 97 años.
Ahora tenemos que multiplicar 97 por 366, 97 x 366 = 35502 (número de días en un año bisiesto en un período de 400 años), permanece (365 x (400-97)) = 110 595 (número de días que no t en un año bisiesto en un período de 400 años).
Luego solo tenemos que sumar estos dos números para saber el número total de días en un período de 400 años: 110 595 + 35502 = 146 097 .
Para finalizar, nuestra probabilidad es el número del 29 de febrero en un período de 400 años, entonces 97 dado que hay 97 años bisiestos divididos por el número total de días de nuestro intervalo:
p = 97/146097 ≈ 0,0006639424492
Espero que esto sea correcto y claro.
Creo que hay dos preguntas que se mezclan aquí. El primero es "¿Cuál es la probabilidad de que un día determinado sea un 29 de febrero?". El segundo es (y el que realmente preguntó) "¿Cuál es la probabilidad de nacer en un día bisiesto?"
El enfoque de simplemente contar días parece ser engañoso, ya que Aksakal lo señala. Contar los días y calcular las frecuencias del 29 de febrero ocurre la pregunta: "¿Cuál es la probabilidad de que un día determinado sea el 29 de febrero?" (Imagínese despertarse después de un coma, no tengo idea de qué día es. La probabilidad de que sea un 29 de febrero es como se señaló anteriormente)
Siguiendo la respuesta de Aksakal, la probabilidad solo puede basarse en estudios empíricos de la distribución de nacimientos a lo largo de los días del año. Diferentes conjuntos de datos llegarán a diferentes conclusiones (por ejemplo, debido a los efectos de la estacionalidad, las tendencias a largo plazo en las tasas de natalidad, las diferencias culturales). Aksakal señaló un estudio (Un comentario: para tener en cuenta la ocurrencia no representativa de un año bisiesto en los datos mencionados (es decir) en comparación con la frecuencia a largo plazo de los años bisiestos (es decir, ) tendrías que multiplicar la frecuencia de nacimiento el 29 de febrero de la muestra por )
Finalmente, hay una tercera interpretación posible de la pregunta, que creo que no fue pensada: "¿Cuál es la probabilidad de que una persona específica nazca en un día bisiesto?" Bueno, para cualquiera que haya nacido eso es fácil. Es cualquiera o . Para cualquier persona que no haya nacido pero que ya haya concebido, también puede estimarse mediante estudios empíricos sobre la duración del embarazo (consulte Wikipedia para obtener una descripción general ). Para cualquiera que aún no haya sido concebido, ver arriba.
Me he dado cuenta de que la mayoría de las respuestas anteriores resuelven esto calculando el número de días bisiestos en un período particular. Hay una manera más simple de obtener la respuesta, 100% precisa, por definición:
Utilizamos los años bisiestos para ajustar el calendario regular (365 días) al año tropical medio (también conocido como año solar medio). El año tropical medio "es el tiempo que tarda el Sol en volver a la misma posición en el ciclo de las estaciones, como se ve desde la Tierra" (Wikipedia). El año tropical varía ligeramente, pero el año tropical promedio (promedio) es aproximadamente 365.24667.
Si los días bisiestos son correctos, la posibilidad de que un día seleccionado al azar sea un día bisiesto es ((año tropical) - (año no bisiesto)) / año tropical
Agregando el número aproximado que tenemos, es (365.24667-365) /365.24667, o 0.24667 / 365.24667, o 675 por millón (0.0675%).
Esto, sin embargo, es para un día seleccionado al azar. Me imagino que esto es sustancialmente sesgado por los padres que prefieren no tener que explicarles a sus hijos, "su cumpleaños real solo llega una vez cada 4 años".
Le pregunté a mi hermana, cuyo cumpleaños es el 29 de febrero, y ella dijo: "El resultado de mi propio estudio empírico fue que obviamente es 1.00".