A un nivel puramente formal, uno podría llamar a la teoría de probabilidad el estudio de espacios de medida con la medida total uno, pero eso sería como llamar a la teoría de números el estudio de cadenas de dígitos que terminan
- de los Temas de Terry Tao en teoría de matrices aleatorias .
Creo que esto es lo realmente fundamental. Si tenemos un espacio de probabilidad y una variable aleatoria con medida de , entonces la razón una densidad integra a uno porque . Y eso es más fundamental que pdfs vs pmfs.(Ω,F,P)X:Ω→RPX:=P∘X−1f=dPXdμP(Ω)=1
Aquí está la prueba:
∫Rfdμ=∫RdPX=PX(R)=P({ω∈Ω:X(ω)∈R})=P(Ω)=1.
Esto es casi una reformulación de la respuesta de AdamO (+1) porque todos los CDF son càdlàg, y hay una relación uno a uno entre el conjunto de CDF en y el conjunto de todas las medidas de probabilidad en , pero como el CDF de un RV se define en términos de su distribución, veo los espacios de probabilidad como el lugar para "comenzar" con este tipo de esfuerzo.R(R,B)
Estoy actualizando para elaborar la correspondencia entre los CDF y las medidas de probabilidad y cómo ambas son respuestas razonables para esta pregunta.
Comenzamos comenzando con dos medidas de probabilidad y analizando los CDF correspondientes. Concluimos comenzando con un CDF y observando la medida inducida por él.
Deje que y sean medidas de probabilidad en y dejar que y sean sus respectivos CDF (es decir y lo mismo para ) y representarían medidas de variables aleatorias (es decir, distribuciones), pero en realidad no importa de dónde vinieron para esto.QR(R,B)FQFRFQ(a)=Q((−∞,a])RQR
La idea clave es esta: si y están de acuerdo en una colección de conjuntos lo suficientemente rica, entonces están de acuerdo con el álgebra generada por esos conjuntos. Intuitivamente, si tenemos una buena colección de eventos que, a través de una cantidad contable de complementos, intersecciones y uniones forman todo , entonces estar de acuerdo en todos esos conjuntos no deja margen de maniobra para estar en desacuerdo con cualquier Borel conjunto.QRσB
Formalicemos eso. Deje y deje , es decir, es el subconjunto de en el que y están de acuerdo (y están definidos). Tenga en cuenta que les estamos permitiendo acordar conjuntos no Borel ya que tal como está 't necesariamente un subconjunto de . Nuestro objetivo es mostrar que .S={(−∞,a]:a∈R}L={A⊆R:Q(A)=R(A)}P ( R ) Q R L B B ⊆ LLP(R)QRLBB⊆L
Resulta que (el álgebra generado por ) es de hecho , por lo que esperamos que sea una colección suficientemente grande de eventos que si todas partes en entonces están obligados a ser igual en todos .σ S B S Q = R S Bσ(S)σSBSQ=RSB
Tenga en cuenta que está cerrado bajo intersecciones finitas, y que está cerrado bajo complementos e intersecciones contables disjuntas (esto se deduce de -adititivity). Esto significa que es un -system y es un -system . Por el - teorema que, por tanto, tenemos que . Los elementos deL σ S π L λ π λ σ ( S ) = B ⊆ L S S Q R S B ∈ BSLσSπLλπλσ(S)=B⊆LSno son tan complejas como un conjunto de Borel arbitrario, sino porque cualquier conjunto de Borel puede formarse a partir de un número contable de complementos, uniones e intersecciones de elementos de , si no hay un único desacuerdo entre y en elementos de , entonces este será seguido a través de a que no hay desacuerdos en cualquier .SQRSB∈B
Acabamos de demostrar que si entonces (en ), lo que significa que el mapa de a es una inyección. Q = R B Q ↦ F Q P : = { P : P es una medida de probabilidad en ( R , B ) } F : = { F : R → R : F es un CDF }FQ=FRQ=RBQ↦FQP:={P:P is a probability measure on (R,B)}F:={F:R→R:F is a CDF}
Ahora, si queremos pensar en ir en la otra dirección, queremos comenzar con un FCD y mostrar que hay una medida de probabilidad única tal que . esto establecerá que nuestro mapeo es de hecho una biyección. Por esta dirección, definimos sin ninguna referencia a la probabilidad o medidas.Q F ( a ) = Q ( ( - ∞ , a ] ) Q ↦ F Q FFQF(a)=Q((−∞,a])Q↦FQF
Primero definimos una función de medida Stieltjes como una función tal queG:R→R
- G no es decreciente
- G es derecho-continuo
(y observe cómo ser càdlàg se deduce de esta definición, pero debido a la restricción adicional no decreciente, "la mayoría" de las funciones càdlàg no son funciones de medida de Stieltjes).
Se puede demostrar que cada función Stieltjes induce una medida única on definida por
(ver, por ejemplo, la probabilidad de Durrett y los procesos aleatorios para más detalles sobre esto.) Por ejemplo, la medida de Lebesgue es inducida por .μ ( R , B ) μ ( ( a , b ] ) = G ( b ) - G ( a ) G ( x ) = xGμ(R,B)
μ((a,b])=G(b)−G(a)
G(x)=x
Ahora observando que un CDF es una función Stieltjes con las propiedades adicionales que y , podemos aplicar ese resultado para mostrar que para cada CDF obtenemos una medida única en definida por
Flimx→−∞F(x):=F(−∞)=0limx→∞F(x):=F(∞)=1FQ(R,B)
Q((a,b])=F(b)−F(a).
Observe cómo y entonces es una medida de probabilidad y es exactamente la que habríamos utilizado para definir si hubiéramos ido en la otra dirección.Q((−∞,a])=F(a)−F(−∞)=F(a)Q((−∞,−∞])=F(∞)−F(−∞)=1QF
Todos juntos hemos visto ahora que la asignación de es 1-1 y en lo que realmente tienen una biyección entre y . Volviendo a la pregunta real, esto muestra que podríamos sostener de manera equivalente CDF o medidas de probabilidad como nuestro objeto del cual declaramos que la probabilidad es el estudio (al tiempo que reconocemos que este es un esfuerzo algo gracioso). Yo personalmente prefiero los espacios de probabilidad porque siento que la teoría fluye más naturalmente en esa dirección, pero los CDF no están "equivocados".Q↦FQPF