Si bien varias publicaciones en el sitio abordan varias propiedades del Cauchy, no pude localizar una que realmente las presentara juntas. Esperemos que este sea un buen lugar para recolectar algunos. Puedo ampliar esto.
Colas pesadas
Mientras que el Cauchy es simétrico y más o menos en forma de campana, algo así como la distribución normal, tiene colas mucho más pesadas (y menos de un "hombro"). Por ejemplo, hay una probabilidad pequeña pero distinta de que una variable aleatoria de Cauchy establezca más de 1000 rangos intercuartiles de la mediana, aproximadamente del mismo orden que una variable aleatoria normal con al menos 2,67 rangos intercuartiles de su mediana.
Diferencia
La varianza de Cauchy es infinita.
Editar: JG dice en los comentarios que no está definido. Si tomamos la varianza como el promedio de la mitad de la distancia al cuadrado entre pares de valores, que es idéntico a la varianza cuando ambos existen, entonces sería infinito. Sin embargo, según la definición habitual, JG es correcto. [Sin embargo, en contraste con los medios muestrales, que realmente no convergen a nada a medida que n se hace grande, la distribución de las variaciones muestrales sigue creciendo en tamaño a medida que aumenta el tamaño muestral; la escala aumenta proporcionalmente a n, o de manera equivalente, la distribución de la variación logarítmica crece linealmente con el tamaño de la muestra. Parece productivo considerar realmente que la versión de la varianza que produce infinito nos está diciendo algo.]
Las desviaciones estándar de la muestra existen, por supuesto, pero cuanto más grande es la muestra, más grandes tienden a ser (por ejemplo, la mediana de la desviación estándar de la muestra en n = 10 está cerca de 3.67 veces el parámetro de escala (la mitad del IQR), pero en n = 100 es aproximadamente 11.9).
Media
La distribución de Cauchy ni siquiera tiene una media finita; la integral para la media no converge. Como resultado, incluso las leyes de los grandes números no se aplican: a medida que crece n, los medios de muestra no convergen a una cantidad fija (de hecho, no hay nada para que converjan).
De hecho, la distribución de la media muestral de una distribución de Cauchy es la misma que la distribución de una sola observación (!). La cola es tan pesada que agregar más valores a la suma hace que un valor realmente extremo sea lo suficientemente probable como para compensar la división por un denominador mayor al tomar la media.
Previsibilidad
Ciertamente, puede producir intervalos de predicción perfectamente sensibles para las observaciones de una distribución de Cauchy; existen estimadores simples y bastante eficientes que funcionan bien para estimar la ubicación y la escala y se pueden construir intervalos de predicción aproximados, por lo que, en ese sentido, al menos, las variables de Cauchy son 'predecibles'. Sin embargo, la cola se extiende muy lejos, por lo que si desea un intervalo de alta probabilidad, puede ser bastante ancho.
Si está tratando de predecir el centro de la distribución (por ejemplo, en un modelo de tipo de regresión), eso puede ser, en cierto sentido, relativamente fácil. de predecir; el Cauchy tiene un pico máximo (hay mucha distribución "cerca" del centro para una medida típica de escala), por lo que el centro puede estimarse relativamente bien si tiene un estimador apropiado.
Aquí hay un ejemplo:
Generé datos a partir de una relación lineal con errores estándar de Cauchy (100 observaciones, intercepción = 3, pendiente = 1.5), y estimé líneas de regresión por tres métodos que son razonablemente robustos para los valores atípicos: línea de grupo Tukey 3 (rojo), regresión de Theil (verde oscuro) y regresión L1 (azul). Ninguno es especialmente eficiente en el Cauchy, aunque todos serían excelentes puntos de partida para un enfoque más eficiente.
Sin embargo, los tres son casi coincidentes en comparación con el ruido de los datos y se encuentran muy cerca del centro de donde se ejecutan los datos; en ese sentido, el Cauchy es claramente "predecible".
La mediana de los residuos absolutos es solo un poco mayor que 1 para cualquiera de las líneas (la mayoría de los datos se encuentran bastante cerca de la línea estimada); en ese sentido también, el Cauchy es "predecible".
Para la trama de la izquierda hay un gran valor atípico. Para ver mejor los datos, reduje la escala en el eje y hacia abajo a la derecha.