¿Por qué la distribución de Cauchy no tiene significado?


109

A partir de la función de densidad de distribución podríamos identificar una media (= 0) para la distribución de Cauchy tal como se muestra en el gráfico a continuación. Pero, ¿por qué decimos que la distribución de Cauchy no tiene sentido?

ingrese la descripción de la imagen aquí


2
Recomiendo la referencia Cabeza G., UA. (2013) La Media de la Distribución de Cauchy. En el blog Apoyo en Matemáticas sobre la media de la distribución de Cauchy.

Respuestas:


99

Puede verificar mecánicamente que el valor esperado no existe, pero esto debería ser físicamente intuitivo, al menos si acepta el principio de Huygens y la Ley de los grandes números . La conclusión de la Ley de Grandes Números falla para una distribución de Cauchy, por lo que no puede tener un significado. Si promedia variables aleatorias Cauchy independientes, el resultado no converge a como con probabilidad . Se mantiene una distribución Cauchy del mismo tamaño. Esto es importante en óptica.0 n 1n0n1

La distribución de Cauchy es la intensidad normalizada de la luz en una línea desde una fuente puntual. El principio de Huygens dice que puede determinar la intensidad suponiendo que la luz se reemite desde cualquier línea entre la fuente y el objetivo. Por lo tanto, la intensidad de la luz en una línea a metros de distancia se puede determinar asumiendo que la luz primero golpea una línea a metro de distancia y se vuelve a emitir en cualquier ángulo hacia adelante. La intensidad de la luz en una línea a metros de distancia se puede expresar como la convolución doble de la distribución de luz en una línea a metro de distancia. Es decir, la suma de distribuciones independientes de Cauchy es una distribución de Cauchy escalada por un factor de .1 n n 1 n n21nn1nn

Si la distribución de Cauchy tuviera una media, entonces el percentil de la convolución de veces dividido entre tendría que converger a por la Ley de Números Grandes. En cambio, se mantiene constante. Si marca el percentil en una línea (transparente) a metro de distancia, a metros de distancia, etc., estos puntos forman una línea recta, a grados. No se inclinan hacia .n n 0 25 1 2 45 025nn02512450

Esto le informa sobre la distribución de Cauchy en particular, pero debe conocer la prueba integral porque hay otras distribuciones sin significado que no tienen una interpretación física clara.


39
+1 Ahora hay una respuesta esclarecedora :-) (lo siento). Por cierto, el principio lleva el nombre de Christiaan Huygens, no Huygen. Huygens fue el primero en apreciar los nuevos desarrollos en probabilidad publicados en la década de 1650 por Pascal (basado en sus cartas con Fermat): fue la explicación de Huygens de estas ideas (1657), incluida la de expectativa, que originalmente obtuvo la teoría de la probabilidad en una matemática pisó y preparó el camino para el tratado seminal (póstumo) de Jakob Bernoulli ( Ars Conjectandi , 1713).
whuber

44
Las amplitudes se propagan, no las intensidades.
Doru Constantin

2
Esta es una gran respuesta, pero el final me resulta confuso: "... marque el percentil 25 en ... una línea recta, a 45 grados. No se inclinan hacia 0". La afirmación en sí misma es cierta (como consecuencia del principio Huygens-Fresnel), pero eso es antes de "dividido por ". Cuando se divide por 2 a 2 metros, dividido por 3 a 3 metros, ..., entonces la línea transparente es vertical (perpendicular a la pantalla que captura la luz). La línea cuantil de 45 grados pertenece a la suma de Cauchy y no ayuda con el argumento (todavía). n
Lee David Chung Lin

40

Respuesta agregada en respuesta al comentario de @ whuber sobre la respuesta de Michael Chernicks (y reescrita completamente para eliminar el error señalado por whuber).

Se dice que el valor de la integral para el valor esperado de una variable aleatoria de Cauchy no está definido porque el valor se puede "hacer" para que sea lo que uno quiera. La integral

xπ(1+x2)dx
- x
xπ(1+x2)dx=limT1limT2+T1T2xπ(1+x2)dx
xπ(1+x2)dx=limT2+limT1T1T2xπ(1+x2)dx

El valor principal de Cauchy se obtiene como un límite único: lugar del doble límite anterior. El valor principal de la integral expectativa se ve fácilmente que ya que el limitand tiene un valor para toda . Pero esto no puede usarse para decir que la media de una variable aleatoria de Cauchy es . Es decir, la media se define como el valor de la integral en el sentido habitual y no en el sentido del valor principal.

limTTTxπ(1+x2)dx
00T0

Para , considere en su lugar la integral que se acerca a un valor límite de como . Cuando , obtenemos el valor principal discutido anteriormente. Por lo tanto, no podemos asignar un significado inequívoco a la expresiónα>0

TαTxπ(1+x2)dx=TTxπ(1+x2)dx+TαTxπ(1+x2)dx=0+ln(1+x2)2π|TαT=12πln(1+α2T21+T2)=12πln(α2+T21+T2)
ln(α)πTα=10
xπ(1+x2)dx
sin especificar cómo se abordaron los dos infinitos, e ignorar este punto lleva a todos tipo de complicaciones y resultados incorrectos porque las cosas no siempre son lo que parecen cuando la leche del valor principal se disfraza como la crema del valor. Es por eso que se dice que la media de la variable aleatoria de Cauchy no está definida en lugar de tener el valor , el valor principal de la integral.0

Si se usa el enfoque de la medida teórica de la probabilidad y la integral del valor esperado se define en el sentido de una integral de Lebesgue, entonces el problema es más simple. existe solo cuando es finito, por lo que no está definido para una variable aleatoria de Cauchy ya que no es finito.g|g|E[X]XE[|X|]


99
La evaluación de la integral del medio es incorrecta: es cero, no un logaritmo. El problema realmente radica en evaluar los dos límites implícitos en las integrales infinitas.
whuber

@whuber Gracias por señalar el error. He reescrito completamente mi respuesta y tu comentario ya no se aplica.
Dilip Sarwate

No entiendo por qué no existe la expectativa de la relación. Si e se distribuyen conjuntamente normalmente con una media diferente de cero, entonces la media de viene dada por , ¿qué me estoy perdiendo? XYZ=XYxyp(x,y)dxdy
Royi

@Drazick No he mencionado la proporción de dos variables aleatorias normales en ninguna parte de mi respuesta. Pregunte a alguien que haya planteado este problema con respecto a las variables aleatorias de Cauchy.
Dilip Sarwate

2
@Drazick Investigue si su integral existe en absoluto. En general, si la densidad de es continua en una vecindad de , E [X ^ {- 1}] $ no existe. X0
Dilip Sarwate

33

Si bien las respuestas anteriores son explicaciones válidas de por qué la distribución de Cauchy no tiene expectativas, el hecho de que la relación de dos variables normales independientes sea Cauchy es igualmente esclarecedor: de hecho, nosotros have y la segunda expectativa es .X1/X2N(0,1)

E[|X1||X2|]=E[|X1|]×E[1|X2|]
+

1
Isuna variable aleatoria Cauchy 'plegada' cuando sé que es Cauchy estándar? ¿Cómo se puede encontrar la distribución de? |X1X2|X1X2|X1X2|
StubbornAtom

1
Sí, este es el valor absoluto de una variante de Cauchy, que tiene así la densidad sobre los números reales positivos. f(x)+f(x)
Xi'an

Si dobla la distribución normal, entoncesno es infinito? E1/|X2|
Albert Chen

Es infinito.
Xi'an

22

El Cauchy no tiene media porque el punto que selecciona (0) no es una media. Es una mediana y una moda . La media para una distribución absolutamente continua se define como donde es la función de densidad y la integral se toma sobre el dominio de (que es to en el caso de Cauchy). Para la densidad de Cauchy, esta integral simplemente no es finita (la mitad de a es y la mitad de a es ).f f - - 0 - 0 xf(x)dxff00


99
No te estoy criticando, @Dilip: estoy aumentando tu observación. Lo que es muy interesante es que la existencia de un valor principal cero podría tentarnos a definir la media de la distribución de Cauchy (o la media de cualquier RV) como el valor principal de la integral. Esto investiga mucho más profundamente la naturaleza de esta pregunta, que se pasa por alto al declarar que la integral es infinita o indefinida: a saber, ¿por qué no funciona el valor principal ? ¿Por qué no sería legítimo usar eso como un medio?
whuber

55
@whuber También es interesante que si trunca la integral en -a y + a para cualquier a> 0 obtiene 0. Entonces, tomando el límite a medida que se aproxima ∞ de la integral simétrica da 0. Otra razón para preguntar por qué no 0 la media.
Michael Chernick

10
@whuber: Tomo su última pregunta en su penúltimo comentario como retórica; en cualquier caso, queremos una convergencia absoluta y "la" razón en mi mente es que queremos que las cosas se comporten como áreas. En particular, debemos ser capaces de cortar cosas (funciones) en pedazos y reorganizarlas a voluntad sin alterar la respuesta que obtenemos. No podemos hacer este corte y reorganizar una función lineal con una distribución de Cauchy, por lo que debemos insistir en que su media no existe.
Cardenal

99
¡Eso, @cardinal, es una buena respuesta! No estaba simplemente siendo retórico, porque la pregunta en sí misma pregunta "¿por qué decimos que [la] distribución de Cauchy no tiene sentido?" Afirmar que la expectativa es indefinida puede satisfacer lo poco curioso, pero la posibilidad de que exista una definición alternativa razonable de la integral (¡y arroje una respuesta intuitivamente correcta!) Debería preocupar a las personas. Su respuesta está cerca de lo que tenía en mente, pero aún está incompleta. Creo que una respuesta satisfactoria identificaría importantes teoremas de teoría estadística que fallan cuando trabajamos con integrales condicionalmente convergentes.
whuber

77
@Dilip Yo también lo pensé, pero después de reflexionar, creo que esto es un poco más desafiante de lo que parece sugerir. Por ejemplo, no hay ningún problema con el Teorema del límite central: por supuesto, requerir una variación garantiza automáticamente una expectativa. Y se prueban muchos teoremas utilizando la Desigualdad de Chebyshev, donde una vez más se nos garantiza una media. Así que realmente tengo curiosidad: ¿cuáles son los grandes teoremas utilizados en la práctica de la estadística en los que realmente tenemos que ser conscientes de los problemas con las expectativas condicionalmente convergentes, pero no convergentes?
whuber

16

La distribución de Cauchy se considera mejor como la distribución uniforme en un círculo unitario, por lo que sería sorprendente si el promedio tuviera sentido. Supongamos que fuera algún tipo de "función de promedio". Es decir, supongamos que, para cada subconjunto finito del círculo unitario, era un punto del círculo unitario. Claramente, tiene que ser "antinatural". Más precisamente, no puede ser equivalente con respecto a las rotaciones. Para obtener la distribución de Cauchy en su forma más usual, pero menos reveladora, proyecte el círculo unitario en el eje x desde (0,1), y use esta proyección para transferir la distribución uniforme en el círculo al eje x.X f ( X ) f ffXf(X)ff

Para entender por qué no existe la media, piense en x como una función en el círculo unitario. Es bastante fácil encontrar un número infinito de arcos disjuntos en el círculo unitario, de modo que, si uno de los arcos tiene una longitud d, entonces x> 1 / 4d en ese arco. Entonces cada uno de estos arcos disjuntos contribuye más de 1/4 a la media, y la contribución total de estos arcos es infinita. Podemos hacer lo mismo otra vez, pero con x <-1 / 4d, con una contribución total menos infinito. Estos intervalos se pueden mostrar con un diagrama, pero ¿se pueden hacer diagramas para Cross Validated?


1
Bienvenido al sitio, @DavidEpstein. Puede crear imágenes con su software preferido y cargarlas en su respuesta haciendo clic en el pequeño icono de imagen (para iniciar el asistente) sobre el campo de respuesta. Desafortunadamente, necesita> = 10 rep para hacerlo. Estoy seguro de que lo tendrás pronto; Mientras tanto, si puede publicar la imagen en cualquier otro lugar en Internet y publicar un enlace a ella en su respuesta, un usuario de mayor reputación puede buscarla y publicarla por usted.
Gung

3
No sabía que Cauchy fuera interpretada como un uniforme en un círculo, pero ciertamente tiene sentido. Un argumento topológico muestra que no puede haber una función continua en un círculo que tenga las propiedades de una función de promedio.
johnny

@DavidEpstein También he leído tu respuesta en la otra publicación . La proyección estereográfica es realmente agradable. En comparación, ¿puede comentar por qué la proyección radial igualmente válida de un semicírculo no implica que la media esté bien definida? A saber, , luego es Cauchy estándar. Geométricamente, este es el hecho básico de que un ángulo inscrito es siempre la mitad de su ángulo central correspondiente. X tan ( π ( U - 1UUnif[0,1]Xtan(π(U12))
Lee David Chung Lin

En realidad, en términos del modelo físico de una fuente de luz, la imagen de semicírculo es más apropiada, ya que no está claro de inmediato por qué el principio de Huygens le daría una proyección estereográfica.
Lee David Chung Lin

10

El valor medio o esperado de alguna variable aleatoria es una integral de Lebesgue definida sobre alguna medida de probabilidad : P E X = X d PXP

EX=XdP

La inexistencia de la media de la variable aleatoria de Cauchy solo significa que la integral de Cauchy rv no existe. Esto se debe a que las colas de distribución de Cauchy son colas pesadas (en comparación con las colas de distribución normal). Sin embargo, la inexistencia del valor esperado no prohíbe la existencia de otras funciones de una variable aleatoria de Cauchy.


55
Las colas son "pesadas" en el sentido de que no se descomponen lo suficientemente rápido en ninguna dirección para hacer que la integral converja. Este concepto no tiene nada que ver con distribuciones normales (o cualquier distribución de referencia).
whuber

44
Sí, gracias por esta corrección. No tengo la intención de implicar ninguna conexión de rigor entre colas pesadas y distribución normal. Sin embargo, creo que comparar visualmente la distribución normal (con colas ligeras) y la distribución de colas pesadas hace que (no siempre) sea un poco más fácil comprender el concepto de colas "pesadas".
Tomás

5

Aquí hay más de una explicación visual. (Para aquellos de nosotros que tenemos desafíos matemáticos). Tome un generador de números aleatorios distribuidos cauchy e intente promediar los valores resultantes. Aquí hay una buena página sobre una función para esto. https://math.stackexchange.com/questions/484395/how-to-generate-a-cauchy-random-variable Encontrará que el "pico" de los valores aleatorios hace que se haga más grande a medida que avanza en lugar de más pequeño . Por lo tanto, no tiene ningún medio.


4

Solo para agregar a las excelentes respuestas, haré algunos comentarios sobre por qué la no convergencia de la integral es relevante para la práctica estadística. Como otros han mencionado, si permitimos que el valor principal sea un "medio", ¡los slln ya no son válidos! Aparte de esto, piense en las implicaciones del hecho de que, en la práctica, todos los modelos son aproximaciones. Específicamente, la distribución de Cauchy es un modelo para una variable aleatoria ilimitada. En la práctica, las variables aleatorias están limitadas, pero los límites son a menudo vagos e inciertos. El uso de modelos ilimitados es una forma de aliviar eso, hace innecesaria la introducción de límites inseguros (y a menudo poco naturales) en los modelos. Pero para que esto tenga sentido, los aspectos importantes del problema no deberían verse afectados. Eso significa que, si tuviéramos que introducir límites, eso no debería alterar de manera importante el modelo. ¡Pero cuando la integral no es convergente, eso no sucede! El modelo es inestable, en el sentido de que la expectativa de la RV dependerá de los límites en gran medida arbitrarios. (En las aplicaciones, ¡no hay necesariamente ninguna razón para hacer que los límites sean simétricos!)

Por esta razón, es mejor decir que la integral es divergente que decir que es "infinito", ¡el último está cerca de implicar algún valor definido cuando no existe! Una discusión más exhaustiva está aquí .


-4

Quería ser un poco exigente por un segundo. El gráfico en la parte superior está mal. El eje x está en desviaciones estándar, algo que no existe para la distribución de Cauchy. Estoy siendo exigente porque uso la distribución Cauchy todos los días de mi vida en mi trabajo. Hay un caso práctico donde la confusión podría causar un error empírico. La distribución t de Student con 1 grado de libertad es el Cauchy estándar. Por lo general, enumerará varias sigmas requeridas para la importancia. Estas sigmas NO son desviaciones estándar, son errores probables y mu es el modo.

Si desea hacer el gráfico anterior correctamente, el eje x es información sin formato o si desea que tengan errores de tamaño equivalente, entonces les daría los mismos errores probables. Un error probable es .67 desviaciones estándar de tamaño en la distribución normal. En ambos casos es el rango semi-intercuartil.

Ahora, en cuanto a una respuesta a su pregunta, todo lo que todos escribieron anteriormente es correcto y es la razón matemática para esto. Sin embargo, sospecho que eres un estudiante y nuevo en el tema y, por lo tanto, las soluciones matemáticas contra intuitivas para lo visualmente obvio pueden no sonar ciertas.

Tengo dos muestras del mundo real casi idénticas, extraídas de una distribución de Cauchy, ambas tienen el mismo modo y el mismo error probable. Uno tiene una media de 1.27 y uno tiene una media de 1.33. El que tiene una media de 1.27 tiene una desviación estándar de 400, el que tiene una media de 1.33 tiene una desviación estándar de 5.15. El error probable para ambos es .32 y el modo es 1. Esto significa que para datos simétricos, la media no está en el 50% central. Solo se necesita UNA observación adicional para empujar la media y / o la varianza fuera de importancia para cualquier prueba. La razón es que la media y la varianza no son parámetros y la media de la muestra y la varianza de la muestra son números aleatorios.

La respuesta más simple es que los parámetros de la distribución de Cauchy no incluyen una media y, por lo tanto, no hay variación sobre una media.

Es probable que en su pedagogía pasada la importancia de la media radicara en que generalmente es una estadística suficiente. En las estadísticas basadas en frecuencia a largo plazo, la distribución de Cauchy no tiene estadística suficiente. Es cierto que la mediana de la muestra, para una distribución de Cauchy con soporte sobre los reales completos, es una estadística suficiente, pero eso se debe a que la hereda de ser una estadística de orden. Es una especie de coincidencia suficiente, ya que carece de una manera fácil de pensarlo. Ahora en las estadísticas bayesianas hay una estadística suficiente para los parámetros de la distribución de Cauchy y si usa un uniforme antes, entonces también es imparcial. Menciono esto porque si tiene que usarlos a diario, ha aprendido sobre todas las formas de realizar estimaciones sobre ellos.

No existen estadísticas de pedido válidas que puedan usarse como estimadores para distribuciones de Cauchy truncadas, que es lo que es probable que encuentre en el mundo real, por lo que no hay estadística suficiente en los métodos basados ​​en la frecuencia para la mayoría de las aplicaciones del mundo real, pero no para todas. .

Lo que sugiero es alejarse de lo malo, mentalmente, como algo real. Es una herramienta, como un martillo, que es ampliamente útil y generalmente se puede usar. A veces esa herramienta no funciona.

Una nota matemática sobre las distribuciones normales y de Cauchy. Cuando los datos se reciben como una serie de tiempo, la distribución normal solo ocurre cuando los errores convergen a cero cuando t llega al infinito. Cuando los datos se reciben como una serie temporal, la distribución de Cauchy ocurre cuando los errores divergen hasta el infinito. Uno se debe a una serie convergente, el otro a una serie divergente. Las distribuciones de Cauchy nunca llegan a un punto específico en el límite, se balancean hacia adelante y hacia atrás a través de un punto fijo, de modo que el cincuenta por ciento de las veces están de un lado y el cincuenta por ciento del otro. No hay reversión mediana.


99
¡Hay cierta confusión en esta respuesta! Por ejemplo, dice "Ahora en las estadísticas bayesianas hay una estadística suficiente para los parámetros de la distribución de Cauchy y si usa un uniforme antes, entonces también es imparcial". ¡Es difícil dar sentido a esto! Primero, los conceptos de suficiencia Frecuentista y Bayesiano son muy cercanos (y creo que solo pueden diferir en algunos espacios de muestra extraños, infinitamente tenues, por lo que la línea real es la misma). ¡No hay estadística suficiente para el modelo Cauchy, de dimensión fija !, simplemente (los datos completos obviamente son suficientes).
kjetil b halvorsen

-6

En pocas palabras, el área debajo de la curva se aproxima al infinito a medida que se aleja. Si muestreas una región finita, puedes encontrar una media para esa región. Sin embargo, no hay un medio para el infinito.


8
El área debajo del PDF es igual a , por definición, por lo que debe significar algo más por "la curva". ¿Qué es? 1
whuber
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.