A partir de la función de densidad de distribución podríamos identificar una media (= 0) para la distribución de Cauchy tal como se muestra en el gráfico a continuación. Pero, ¿por qué decimos que la distribución de Cauchy no tiene sentido?
A partir de la función de densidad de distribución podríamos identificar una media (= 0) para la distribución de Cauchy tal como se muestra en el gráfico a continuación. Pero, ¿por qué decimos que la distribución de Cauchy no tiene sentido?
Respuestas:
Puede verificar mecánicamente que el valor esperado no existe, pero esto debería ser físicamente intuitivo, al menos si acepta el principio de Huygens y la Ley de los grandes números . La conclusión de la Ley de Grandes Números falla para una distribución de Cauchy, por lo que no puede tener un significado. Si promedia variables aleatorias Cauchy independientes, el resultado no converge a como con probabilidad . Se mantiene una distribución Cauchy del mismo tamaño. Esto es importante en óptica.0 n → ∞ 1
La distribución de Cauchy es la intensidad normalizada de la luz en una línea desde una fuente puntual. El principio de Huygens dice que puede determinar la intensidad suponiendo que la luz se reemite desde cualquier línea entre la fuente y el objetivo. Por lo tanto, la intensidad de la luz en una línea a metros de distancia se puede determinar asumiendo que la luz primero golpea una línea a metro de distancia y se vuelve a emitir en cualquier ángulo hacia adelante. La intensidad de la luz en una línea a metros de distancia se puede expresar como la convolución doble de la distribución de luz en una línea a metro de distancia. Es decir, la suma de distribuciones independientes de Cauchy es una distribución de Cauchy escalada por un factor de .1 n n 1 n n
Si la distribución de Cauchy tuviera una media, entonces el percentil de la convolución de veces dividido entre tendría que converger a por la Ley de Números Grandes. En cambio, se mantiene constante. Si marca el percentil en una línea (transparente) a metro de distancia, a metros de distancia, etc., estos puntos forman una línea recta, a grados. No se inclinan hacia .n n 0 25 1 2 45 0
Esto le informa sobre la distribución de Cauchy en particular, pero debe conocer la prueba integral porque hay otras distribuciones sin significado que no tienen una interpretación física clara.
Respuesta agregada en respuesta al comentario de @ whuber sobre la respuesta de Michael Chernicks (y reescrita completamente para eliminar el error señalado por whuber).
Se dice que el valor de la integral para el valor esperado de una variable aleatoria de Cauchy no está definido porque el valor se puede "hacer" para que sea lo que uno quiera. La integral
El valor principal de Cauchy se obtiene como un límite único: lugar del doble límite anterior. El valor principal de la integral expectativa se ve fácilmente que ya que el limitand tiene un valor para toda . Pero esto no puede usarse para decir que la media de una variable aleatoria de Cauchy es . Es decir, la media se define como el valor de la integral en el sentido habitual y no en el sentido del valor principal.
Para , considere en su lugar la integral que se acerca a un valor límite de como . Cuando , obtenemos el valor principal discutido anteriormente. Por lo tanto, no podemos asignar un significado inequívoco a la expresión
Si se usa el enfoque de la medida teórica de la probabilidad y la integral del valor esperado se define en el sentido de una integral de Lebesgue, entonces el problema es más simple. existe solo cuando es finito, por lo que no está definido para una variable aleatoria de Cauchy ya que no es finito.
Si bien las respuestas anteriores son explicaciones válidas de por qué la distribución de Cauchy no tiene expectativas, el hecho de que la relación de dos variables normales independientes sea Cauchy es igualmente esclarecedor: de hecho, nosotros have y la segunda expectativa es .
El Cauchy no tiene media porque el punto que selecciona (0) no es una media. Es una mediana y una moda . La media para una distribución absolutamente continua se define como donde es la función de densidad y la integral se toma sobre el dominio de (que es to en el caso de Cauchy). Para la densidad de Cauchy, esta integral simplemente no es finita (la mitad de a es y la mitad de a es ).f f - ∞ ∞ - ∞ 0 - ∞ 0 ∞ ∞
La distribución de Cauchy se considera mejor como la distribución uniforme en un círculo unitario, por lo que sería sorprendente si el promedio tuviera sentido. Supongamos que fuera algún tipo de "función de promedio". Es decir, supongamos que, para cada subconjunto finito del círculo unitario, era un punto del círculo unitario. Claramente, tiene que ser "antinatural". Más precisamente, no puede ser equivalente con respecto a las rotaciones. Para obtener la distribución de Cauchy en su forma más usual, pero menos reveladora, proyecte el círculo unitario en el eje x desde (0,1), y use esta proyección para transferir la distribución uniforme en el círculo al eje x.X f ( X ) f f
Para entender por qué no existe la media, piense en x como una función en el círculo unitario. Es bastante fácil encontrar un número infinito de arcos disjuntos en el círculo unitario, de modo que, si uno de los arcos tiene una longitud d, entonces x> 1 / 4d en ese arco. Entonces cada uno de estos arcos disjuntos contribuye más de 1/4 a la media, y la contribución total de estos arcos es infinita. Podemos hacer lo mismo otra vez, pero con x <-1 / 4d, con una contribución total menos infinito. Estos intervalos se pueden mostrar con un diagrama, pero ¿se pueden hacer diagramas para Cross Validated?
El valor medio o esperado de alguna variable aleatoria es una integral de Lebesgue definida sobre alguna medida de probabilidad : P E X = ∫ X d P
La inexistencia de la media de la variable aleatoria de Cauchy solo significa que la integral de Cauchy rv no existe. Esto se debe a que las colas de distribución de Cauchy son colas pesadas (en comparación con las colas de distribución normal). Sin embargo, la inexistencia del valor esperado no prohíbe la existencia de otras funciones de una variable aleatoria de Cauchy.
Aquí hay más de una explicación visual. (Para aquellos de nosotros que tenemos desafíos matemáticos). Tome un generador de números aleatorios distribuidos cauchy e intente promediar los valores resultantes. Aquí hay una buena página sobre una función para esto. https://math.stackexchange.com/questions/484395/how-to-generate-a-cauchy-random-variable Encontrará que el "pico" de los valores aleatorios hace que se haga más grande a medida que avanza en lugar de más pequeño . Por lo tanto, no tiene ningún medio.
Solo para agregar a las excelentes respuestas, haré algunos comentarios sobre por qué la no convergencia de la integral es relevante para la práctica estadística. Como otros han mencionado, si permitimos que el valor principal sea un "medio", ¡los slln ya no son válidos! Aparte de esto, piense en las implicaciones del hecho de que, en la práctica, todos los modelos son aproximaciones. Específicamente, la distribución de Cauchy es un modelo para una variable aleatoria ilimitada. En la práctica, las variables aleatorias están limitadas, pero los límites son a menudo vagos e inciertos. El uso de modelos ilimitados es una forma de aliviar eso, hace innecesaria la introducción de límites inseguros (y a menudo poco naturales) en los modelos. Pero para que esto tenga sentido, los aspectos importantes del problema no deberían verse afectados. Eso significa que, si tuviéramos que introducir límites, eso no debería alterar de manera importante el modelo. ¡Pero cuando la integral no es convergente, eso no sucede! El modelo es inestable, en el sentido de que la expectativa de la RV dependerá de los límites en gran medida arbitrarios. (En las aplicaciones, ¡no hay necesariamente ninguna razón para hacer que los límites sean simétricos!)
Por esta razón, es mejor decir que la integral es divergente que decir que es "infinito", ¡el último está cerca de implicar algún valor definido cuando no existe! Una discusión más exhaustiva está aquí .
Quería ser un poco exigente por un segundo. El gráfico en la parte superior está mal. El eje x está en desviaciones estándar, algo que no existe para la distribución de Cauchy. Estoy siendo exigente porque uso la distribución Cauchy todos los días de mi vida en mi trabajo. Hay un caso práctico donde la confusión podría causar un error empírico. La distribución t de Student con 1 grado de libertad es el Cauchy estándar. Por lo general, enumerará varias sigmas requeridas para la importancia. Estas sigmas NO son desviaciones estándar, son errores probables y mu es el modo.
Si desea hacer el gráfico anterior correctamente, el eje x es información sin formato o si desea que tengan errores de tamaño equivalente, entonces les daría los mismos errores probables. Un error probable es .67 desviaciones estándar de tamaño en la distribución normal. En ambos casos es el rango semi-intercuartil.
Ahora, en cuanto a una respuesta a su pregunta, todo lo que todos escribieron anteriormente es correcto y es la razón matemática para esto. Sin embargo, sospecho que eres un estudiante y nuevo en el tema y, por lo tanto, las soluciones matemáticas contra intuitivas para lo visualmente obvio pueden no sonar ciertas.
Tengo dos muestras del mundo real casi idénticas, extraídas de una distribución de Cauchy, ambas tienen el mismo modo y el mismo error probable. Uno tiene una media de 1.27 y uno tiene una media de 1.33. El que tiene una media de 1.27 tiene una desviación estándar de 400, el que tiene una media de 1.33 tiene una desviación estándar de 5.15. El error probable para ambos es .32 y el modo es 1. Esto significa que para datos simétricos, la media no está en el 50% central. Solo se necesita UNA observación adicional para empujar la media y / o la varianza fuera de importancia para cualquier prueba. La razón es que la media y la varianza no son parámetros y la media de la muestra y la varianza de la muestra son números aleatorios.
La respuesta más simple es que los parámetros de la distribución de Cauchy no incluyen una media y, por lo tanto, no hay variación sobre una media.
Es probable que en su pedagogía pasada la importancia de la media radicara en que generalmente es una estadística suficiente. En las estadísticas basadas en frecuencia a largo plazo, la distribución de Cauchy no tiene estadística suficiente. Es cierto que la mediana de la muestra, para una distribución de Cauchy con soporte sobre los reales completos, es una estadística suficiente, pero eso se debe a que la hereda de ser una estadística de orden. Es una especie de coincidencia suficiente, ya que carece de una manera fácil de pensarlo. Ahora en las estadísticas bayesianas hay una estadística suficiente para los parámetros de la distribución de Cauchy y si usa un uniforme antes, entonces también es imparcial. Menciono esto porque si tiene que usarlos a diario, ha aprendido sobre todas las formas de realizar estimaciones sobre ellos.
No existen estadísticas de pedido válidas que puedan usarse como estimadores para distribuciones de Cauchy truncadas, que es lo que es probable que encuentre en el mundo real, por lo que no hay estadística suficiente en los métodos basados en la frecuencia para la mayoría de las aplicaciones del mundo real, pero no para todas. .
Lo que sugiero es alejarse de lo malo, mentalmente, como algo real. Es una herramienta, como un martillo, que es ampliamente útil y generalmente se puede usar. A veces esa herramienta no funciona.
Una nota matemática sobre las distribuciones normales y de Cauchy. Cuando los datos se reciben como una serie de tiempo, la distribución normal solo ocurre cuando los errores convergen a cero cuando t llega al infinito. Cuando los datos se reciben como una serie temporal, la distribución de Cauchy ocurre cuando los errores divergen hasta el infinito. Uno se debe a una serie convergente, el otro a una serie divergente. Las distribuciones de Cauchy nunca llegan a un punto específico en el límite, se balancean hacia adelante y hacia atrás a través de un punto fijo, de modo que el cincuenta por ciento de las veces están de un lado y el cincuenta por ciento del otro. No hay reversión mediana.
En pocas palabras, el área debajo de la curva se aproxima al infinito a medida que se aleja. Si muestreas una región finita, puedes encontrar una media para esa región. Sin embargo, no hay un medio para el infinito.