¿Cuándo son útiles los intervalos de confianza?


30

Si entiendo correctamente, un intervalo de confianza de un parámetro es un intervalo construido por un método que produce intervalos que contienen el valor verdadero para una proporción específica de muestras. Entonces, la "confianza" se trata del método en lugar del intervalo que calculo de una muestra particular.

Como usuario de estadísticas, siempre me he sentido engañado por esto, ya que el espacio de todas las muestras es hipotético. Todo lo que tengo es una muestra y quiero saber qué me dice esa muestra sobre un parámetro.

¿Es este juicio incorrecto? ¿Hay formas de ver los intervalos de confianza, al menos en algunas circunstancias, que serían significativos para los usuarios de estadísticas?

[Esta pregunta surge de dudas después de ignorar los intervalos de confianza en una respuesta matemática https://math.stackexchange.com/questions/7564/calculating-a-sample-size-based-on-a-confidence-level/7572 # 7572 ]

Respuestas:


15

Me gusta pensar en los IC como una forma de escapar del marco de Prueba de Hipótesis (HT), al menos el marco de decisión binario que sigue el enfoque de Neyman , y mantenerme en línea con la teoría de la medición de alguna manera. Más precisamente, los veo más cercanos a la confiabilidad de una estimación (una diferencia de medios, por ejemplo), y por el contrario, los HT están más cerca del razonamiento hipotético-deductivo, con sus trampas (no podemos aceptar el nulo, la alternativa es a menudo estocástico, etc.). Aún así, tanto con la estimación de intervalo como con la HT, tenemos que confiar en supuestos de distribución la mayor parte del tiempo (por ejemplo, una distribución de muestreo bajo ), lo que permite hacer inferencia de nuestra muestra a la población general o representativa (al menos en la frecuencia frecuente). enfoque).H0 0

En muchos contextos, los CI son complementarios a la HT habitual, y los veo como en la siguiente imagen (está debajo de ):H0 0

texto alternativo

es decir, bajo el marco HT (izquierda), observa qué tan lejos está su estadística del valor nulo, mientras que con los elementos de configuración (derecha) observa el efecto nulo "de su estadística", en cierto sentido.

Además, tenga en cuenta que para cierto tipo de estadística, como odds-ratio, HT a menudo no tiene sentido y es mejor observar su IC asociado que es asimétrico y proporcionar información más relevante en cuanto a la dirección y precisión de la asociación, si corresponde.


¿Por qué dice que las pruebas de hipótesis a menudo no tienen sentido para las razones de posibilidades, más que cualquier otra estimación de efectos? En cambio, enfatizaría que los intervalos de confianza son más útiles que los errores estándar para odds ratios y otras estimaciones con distribuciones de muestreo asimétricas en muestras finitas.
onestop

@onestop Bueno, estaba pensando en parte en lo que usted dice sobre "distribuciones de muestreo asimétricas ..." (y parece que no estaba tan claro), sino también en el hecho de que en los estudios epidemiológicos generalmente estamos más interesados ​​en los IC (que es decir, qué tan precisa es nuestra estimación) que HT.
chl

+1. Esto me recuerda que he estado usando sus scripts para aprender asíntota al saltar y cambiar cosas, intentando cosas diferentes. Gracias de nuevo por eso, muy útil para comenzar.
ars

@ars En realidad, me parece recordar que esta foto fue hecha con PStricks. De todos modos, un buen punto de partida para Asymptote es piprime.fr/asymptote .
chl

@chl, esto puede estar fuera de tema, pero ¿podría decirme si hizo estos gráficos en R?
suncoolsu el

7

Un enfoque alternativo relevante para su 2da P, "¿Hay formas de ver los intervalos de confianza, al menos en algunas circunstancias, que serían significativos para los usuarios de estadísticas?":

Debe echar un vistazo a la inferencia bayesiana y los intervalos creíbles resultantes . Un intervalo creíble del 95% se puede interpretar como un intervalo que cree que tiene una probabilidad del 95% de incluir el valor del parámetro verdadero. El precio que paga es que necesita poner una distribución de probabilidad previa en los valores que cree que es probable que tome el parámetro verdadero antes de recopilar los datos. Y su anterior puede diferir del anterior de otra persona, por lo que sus intervalos creíbles resultantes también pueden diferir incluso cuando utiliza los mismos datos.

¡Este es solo mi intento rápido y crudo de resumir! Un buen libro de texto reciente con un enfoque práctico es:

Andrew Gelman, John B. Carlin, Hal S. Stern y Donald B. Rubin. "Análisis de datos bayesianos" (2ª edición). Chapman & Hall / CRC, 2003. ISBN 978-1584883883


Gracias. Pero, ¿qué pasa con los intervalos de confianza frecuentistas específicamente? ¿Hay alguna circunstancia en la que serían relevantes?
Jyotirmoy Bhattacharya

Creo que tener antecedentes diferentes no es un problema (al menos desde el punto de vista objetivo bayesiano), si sucede que tienes un conocimiento diferente sobre la situación en cuestión. Meed para ver los antecedentes como una forma de emitir nuestra información a priori. Sé que no es simple ...
teucer

@Jyotirmoy Acerca de los enfoques bayesianos vs. frecuentistas, se hicieron puntos interesantes aquí: stats.stackexchange.com/questions/1611/…
chl

6

Creo que la premisa de esta pregunta es errónea porque niega la distinción entre lo incierto y lo conocido .

Describir un lanzamiento de moneda proporciona una buena analogía. Antes de lanzar la moneda, el resultado es incierto; luego, ya no es "hipotético". Confundir este hecho consumado con la situación real que deseamos comprender (el comportamiento de la moneda o las decisiones que se tomarán como resultado de su resultado) esencialmente niega un papel de probabilidad en la comprensión del mundo.

Este contraste se presenta con un fuerte relieve dentro de un campo experimental o regulatorio. En tales casos, el científico o el regulador saben que se enfrentarán a situaciones cuyos resultados, en cualquier momento de antemano, son desconocidos, sin embargo, deben tomar determinaciones importantes, como la forma de diseñar el experimento o establecer los criterios para determinar el cumplimiento de las regulaciones (para pruebas de drogas, seguridad en el lugar de trabajo, estándares ambientales, etc.). Estas personas y las instituciones para las que trabajan necesitan métodos y conocimiento de las características probabilísticas de esos métodos para desarrollar estrategias óptimas y defendibles, como buenos diseños experimentales y procedimientos de decisión justos que tengan el menor error posible.

Los intervalos de confianza, a pesar de su pobre justificación clásica, se ajustan a este marco teórico de decisión. Cuando un método para construir un intervalo aleatorio tiene una combinación de buenas propiedades, como asegurar una cobertura mínima esperada del intervalo y minimizar la duración esperada del intervalo, ambas propiedades a priori , no a posteriori , entonces Con una larga carrera en el uso de ese método, podemos minimizar los costos asociados con las acciones indicadas por ese método.


Dé un ejemplo del uso de un intervalo de confianza para tomar una decisión. O, mejor aún, compare dos intervalos de confianza y cómo tomaría diferentes decisiones con cada uno, mientras se mantiene completamente en el marco frecuentista.
BrainPermafrost

@Brain Cualquier libro de texto de estadísticas introductorias proporcionará tales ejemplos. Uno que es descaradamente frecuente es Freedman, Pisani y Purves, Statistics (cualquier edición).
whuber

6

Tiene razón al decir que los intervalos de confianza del 95% son cosas que resultan del uso de un método que funciona en el 95% de los casos, en lugar de cualquier intervalo individual que tenga una probabilidad del 95% de contener el valor esperado.

"La base lógica y la interpretación de los límites de confianza son, incluso ahora, un tema de controversia". {David Colquhoun, 1971, Conferencias sobre bioestadística}

Esa cita está tomada de un libro de texto de estadísticas publicado en 1971, pero afirmaría que todavía es cierto en 2010. La controversia es probablemente más extrema en el caso de intervalos de confianza para proporciones binomiales. Existen muchos métodos competitivos para calcular esos intervalos de confianza, pero todos son inexactos en uno o más sentidos e incluso el método de peor desempeño tiene defensores entre los autores de libros de texto. Incluso los llamados intervalos "exactos" no producen las propiedades esperadas de los intervalos de confianza.

En un artículo escrito para cirujanos (¡ampliamente conocido por su interés en las estadísticas!), John Ludbrook y yo abogamos por el uso rutinario de intervalos de confianza calculados utilizando un Bayesiano previo uniforme porque dichos intervalos tienen propiedades frecuentas tan buenas como cualquier otro método (en promedio exactamente el 95% de cobertura sobre todas las proporciones verdaderas) pero, lo que es más importante, una cobertura mucho mejor sobre todas las proporciones observadas (exactamente el 95% de cobertura). El documento, debido a su público objetivo, no es terriblemente detallado y, por lo tanto, puede no convencer a todos los estadísticos, pero estoy trabajando en un documento de seguimiento con el conjunto completo de resultados y justificaciones.

Este es un caso en el que el enfoque bayesiano tiene propiedades frecuentistas tan buenas como el enfoque frecuentista, algo que ocurre con bastante frecuencia. La suposición de un previo uniforme no es problemática porque una distribución uniforme de las proporciones de la población está integrada en cada cálculo de cobertura frecuentista que he encontrado.

Usted pregunta: "¿Hay formas de ver los intervalos de confianza, al menos en algunas circunstancias, que serían significativos para los usuarios de estadísticas?" Mi respuesta, entonces, es que para intervalos de confianza binomiales se pueden obtener intervalos que contienen la proporción de la población exactamente el 95% del tiempo para todas las proporciones observadas. Eso es un si. Sin embargo, el uso convencional de intervalos de confianza espera cobertura para todas las proporciones de la población y para eso la respuesta es "¡No!"

La longitud de las respuestas a su pregunta y las diversas respuestas a ellas sugieren que los intervalos de confianza son ampliamente incomprendidos. Si cambiamos nuestro objetivo de la cobertura para todos los valores de parámetros verdaderos a la cobertura del valor de parámetros verdaderos para todos los valores de muestra, podría ser más fácil porque los intervalos se configurarán para ser directamente relevantes para los valores observados en lugar de para el desempeño de método per se.


5

Esta es una gran discusión. Siento que los intervalos bayesianos creíbles y los intervalos de probabilidad de apoyo son el camino a seguir, así como las probabilidades bayesianas posteriores de eventos de interés (por ejemplo, un medicamento es eficaz). Pero suplantar los valores de P con intervalos de confianza es una ganancia importante. Prácticamente todos los números de las mejores revistas médicas como NEJM y JAMA tienen un documento con el problema "la ausencia de evidencia no es evidencia de ausencia" en sus resúmenes. El uso de intervalos de confianza evitará en gran medida tales errores. Un pequeño texto excelente es http://www.amazon.com/Statistics-Confidence-Intervals-Statistical-Guidelines/dp/0727913751


3

Para responder a su pregunta directamente: suponga que está contemplando el uso de una máquina para llenar una caja de cereal con una cierta cantidad de cereal. Obviamente, no desea sobrellenar / llenar en exceso la caja. Desea evaluar la fiabilidad de la máquina. Realiza una serie de pruebas como esta: (a) Use la máquina para llenar la caja y (b) Mida la cantidad de cereal que se llena en la caja.

Con los datos recopilados, construye un intervalo de confianza para la cantidad de cereal que la máquina probablemente llene en la casilla. Este intervalo de confianza nos dice que el intervalo que obtuvimos tiene una probabilidad del 95% de que contendrá la cantidad real de cereal que la máquina pondrá en la caja. Como usted dice, la interpretación del intervalo de confianza se basa en muestras hipotéticas e invisibles generadas por el método considerado. Pero, esto es precisamente lo que queremos en nuestro contexto. En el contexto anterior, a utilizar la máquina varias veces para llenar la caja y por lo tanto que se preocupan por hipotéticos realizaciones, invisibles de la cantidad de cereales los rellenos de la máquina en la caja.

Para abstraerse del contexto anterior: un intervalo de confianza nos da la garantía de que si usáramos el método bajo investigación (en el método de ejemplo anterior = máquina) repetidamente, hay un 95% de probabilidad de que el intervalo de confianza tenga el parámetro verdadero .


2
μσ2μ

1
@Jyotirmoy Por supuesto, un IC específico puede estar muy alejado. En otras palabras, hay un 5% de posibilidades de que el IC no contenga el valor verdadero. Sin embargo, la interpretación que di es coherente con la forma en que se construyen los IC. Nos imaginamos usando el método repetidamente y construimos el IC de tal manera que la probabilidad de que el IC observado contenga el valor verdadero es 0.95. Tenga en cuenta que mi respuesta no dice nada sobre la probabilidad de dónde se encuentra realmente el valor verdadero, ya que es una declaración que solo se puede hacer con intervalos creíbles y no intervalos de confianza.

1
(100-α)H0 0tz

@Srikant. Quizás entendí mal "método = máquina" en la respuesta. Pensé que estaba diciendo que el 95% de todas las cajas que salen de la línea de ensamblaje tendrían pesos dentro del intervalo de confianza del 95% derivado de una muestra particular de las cajas.
Jyotirmoy Bhattacharya
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.