TL; DR No parece que sea posible definir una definición frecuente de probabilidad consistente con el marco de Kolmogorov que no es completamente circular (es decir, en el sentido de la lógica circular).
nA
limn→∞nAn
nA
Pero todas estas nociones de convergencia requieren una medida en el espacio de probabilidad que se definirá para ser significativo. La elección intuitiva, por supuesto, sería elegir convergencia casi con seguridad. Esto tiene la característica de que el límite debe existir puntualmente excepto en un evento de medida cero. Lo que constituye un conjunto de medida cero coincidirá con cualquier familia de medidas que sean absolutamente continuas entre sí, lo que nos permite definir una noción de convergencia casi segura que hace que el límite anterior sea riguroso y, al mismo tiempo, sea algo agnóstico sobre lo que subyace La medida para el espacio medible de eventos es (es decir, porque podría ser cualquier medida absolutamente continua con respecto a alguna medida elegida). Esto evitaría la circularidad en la definición que surgiría de fijar una medida dada de antemano,
Sin embargo, si estamos utilizando una convergencia casi segura, eso significa que nos estamos limitando a la situación de la ley fuerte de los grandes números (en adelante SLLN). Permítanme establecer ese teorema (como se da en la página 133 de Chung) a modo de referencia aquí:
Sea una secuencia de variables aleatorias independientes, distribuidas idénticamente. Entonces tenemos donde .E | X 1 | < ∞{Xn}
E|X1|<∞⟹Snn→E(X1)a.s.
S n : = X 1 + X 2 + ⋯ + X nE|X1|=∞⟹limsupn→∞|Sn|n=+∞a.s.
Sn:=X1+X2+⋯+Xn
Entonces, supongamos que tenemos un espacio medible y queremos definir la probabilidad de algún evento con respecto a alguna familia de medidas de probabilidad mutuamente absolutamente continua . Luego, mediante el Teorema de extensión de Kolmogorov o el Teorema de extensión de Ionescu Tulcea (creo que ambos funcionan), podemos construir una familia de espacios de producto , uno para cada . (Tenga en cuenta que la existencia de espacios de productos infinitos que es una conclusión del teorema de Kolmogorov requiere que la medida de cada espacio sea , por lo tanto, ahora estoy restringiendo a la probabilidad, en lugar de medidas arbitrarias). Luego definaA ∈ F(X,F)A∈F { ( ∏ ∞ j = 1 X j ) i } i ∈ I μ i 1 1 A j 1 A j 0 n A = 1 A 1 + 1 A 2 + ⋯ + 1 A n . 0 ≤ E i{μi}i∈I{(∏∞j=1Xj)i}i∈Iμi11Aj para ser la variable aleatoria del indicador, es decir, que equivale a si aparece en la copia y si no es así, en otras palabrasEntonces claramente (donde denota expectativa con respecto a ), por lo que la ley fuerte de los grandes números de hecho aplicar a (porque por construcción el1Aj0
nA=1A1+1A2+⋯+1An.
E i μ i ( ∏ ∞ j = 1 X j ) i 1 A j n A0≤Ei1Aj≤1Eiμi(∏∞j=1Xj)i1Ajestán distribuidos de forma idéntica e independiente: tenga en cuenta que estar distribuido independientemente significa que la medida del espacio del producto es multiplicativa con respecto a las medidas de coordenadas), por lo que obtenemos que y, por lo tanto, nuestra definición de la probabilidad de con respecto a debería ser naturalmente .
A μ i E 1 1 AnAn→Ei1A1a.s.
AμiE11A
Sin embargo, acabo de cuenta de que, aunque la secuencia de variables aleatorias convergerá casi seguramente con respecto a si y solo si converge casi con seguridad con respecto a , ( donde ) eso no significa necesariamente que convergerá al mismo valor ; de hecho, el SLLN garantiza que no lo hará a menos que cual no es cierto genéricamente. μi1μi2i1,i2∈IEi11A=Ei21AnAnμi1μi2i1,i2∈IEi11A=Ei21A
Si es de alguna manera "lo suficientemente canónica", por ejemplo, como la distribución uniforme para un conjunto finito, entonces tal vez esto funcione bien, pero realmente no da ninguna idea nueva. En particular, para la distribución uniforme, , es decir, la probabilidad de es solo la proporción de puntos o eventos elementales en que pertenecer a , que nuevamente me parece algo circular. Para una variable aleatoria continua, no veo cómo podríamos estar de acuerdo en una elección "canónica" de .μE1A=|A||X|AXAμ
Es decir, parece tener sentido definir la frecuencia de un evento como la probabilidad del evento, pero no parece tener sentido definir la probabilidad de que el evento sea la frecuencia (al menos sin ser circular). Esto es especialmente problemático, ya que en la vida real no sabemos cuál es la probabilidad; Tenemos que estimarlo.
También tenga en cuenta que esta definición de frecuencia para un subconjunto de un espacio medible depende de que la medida elegida sea un espacio de probabilidad; por ejemplo, no existe una medida del producto para innumerables copias de dotadas con la medida de Lebesgue, ya que . Del mismo modo, la medida de usando la medida del producto canónico es , que explota hasta el infinito si o llega a cero si , es decir, los teoremas de extensión de Kolmogorov y Tulcea son resultados muy especiales propios de las medidas de probabilidad . μ ( R ) = ∞ ∏ n j = 1 X ( μ ( X ) ) n μ ( X ) > 1 μ ( X ) < 1Rμ(R)=∞∏nj=1X(μ(X))nμ(X)>1μ(X)<1