Significado real de elipse de confianza


12

Al leer sobre el verdadero significado de la elipse de confianza del 95%, tiendo a encontrar 2 explicaciones:

  1. La elipse que contiene el 95% de los datos.
  2. No es lo anterior, sino la elipse que explica la varianza de los datos. No estoy seguro de entenderlo correctamente, pero parecen significar que si entra un nuevo punto de datos, hay un 95% de posibilidades de que la nueva varianza permanezca en la elipse.

¿Puedes arrojar algo de luz?

Respuestas:


15

En realidad, ninguna de las explicaciones es correcta.

Una elipse de confianza tiene que ver con parámetros poblacionales no observados , como la media poblacional real de su distribución bivariada. Una elipse de confianza del 95% para esta media es realmente un algoritmo con la siguiente propiedad: si replicara su muestreo de la distribución subyacente muchas veces y cada vez calcule una elipse de confianza, entonces el 95% de las elipses así construidas contendrían el subyacente media. (Tenga en cuenta que, por supuesto, cada muestra produciría una elipse diferente).

Por lo tanto, una elipse de confianza generalmente no contendrá el 95% de las observaciones. De hecho, a medida que aumenta el número de observaciones, la media generalmente será mejor y mejor estimada, lo que conducirá a elipses de confianza cada vez más pequeños, que a su vez contienen una proporción cada vez menor de los datos reales. (Desafortunadamente, algunas personas calculan la elipse más pequeña que contiene el 95% de sus datos, que recuerda a un cuantil, que por sí solo está bastante bien ... pero luego llaman a esta "elipse cuantil" una "elipse de confianza", que, como ves, lleva a la confusión.)

La varianza de la población subyacente se relaciona con la elipse de confianza. Una varianza alta significará que los datos están por todas partes, por lo que la media no se estima bien, por lo que la elipse de confianza será mayor que si la varianza fuera menor.

Por supuesto, también podemos calcular elipses de confianza para cualquier otro parámetro de población que deseemos estimar. O podríamos mirar otras regiones de confianza que las elipses, especialmente si no sabemos el parámetro estimado que se distribuye (asintóticamente) normalmente.

El análogo unidimensional de la elipse de confianza es el , y es útil explorar las preguntas anteriores en esta etiqueta. Nuestra pregunta actual más votada en esta etiqueta es particularmente agradable: ¿por qué un IC del 95% no implica una probabilidad del 95% de contener la media? La mayor parte de la discusión allí es igualmente válida para los análogos dimensionales superiores del intervalo de confianza unidimensional.


1

Depende del área a la que se aplica este concepto. Lo que se dijo anteriormente es cierto para las estadísticas, pero cuando aplicamos estadísticas a otros temas, las cosas son un poco diferentes. En biomecánica, por ejemplo, usamos el término elipse de confianza (aunque existe un debate sobre si debería ser elipse de predicción) como una técnica para medir el desplazamiento del centro de presión cuando un sujeto se encuentra en una plataforma de fuerza. Entonces, se supone que la elipse que se dibuja alrededor de los dos ejes (mayor y menor) contiene el 95% de los puntos de datos que representan el centro del desplazamiento de presión durante el tiempo de una prueba.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.