He estado mirando numerosas preguntas en este sitio sobre el arranque y los intervalos de confianza, pero todavía estoy confundido. Probablemente, parte de la razón de mi confusión es que no estoy lo suficientemente avanzado en mi conocimiento de estadísticas para comprender muchas de las respuestas. Estoy a mitad de camino de un curso introductorio de estadística y mi nivel de matemáticas es solo a mediados de Álgebra II, por lo que cualquier cosa que supere ese nivel me confunde. Si una de las personas con conocimientos en este sitio pudiera explicar este problema a mi nivel, sería extremadamente útil.
Estábamos aprendiendo en clase cómo tomar muestras usando el método bootstrap y usarlas para construir un intervalo de confianza para algunas estadísticas que nos gustaría medir. Entonces, por ejemplo, digamos que tomamos una muestra de una gran población y encontramos que el 40% dice que votará por el candidato A. Suponemos que esta muestra es un reflejo bastante preciso de la población original, en cuyo caso podemos tomar muestras de descubrir algo sobre la población. Por lo tanto, tomamos muestras y encontramos (utilizando un nivel de confianza del 95%) que el intervalo de confianza resultante oscila entre el 35% y el 45%.
Mi pregunta es, ¿qué significa realmente este intervalo de confianza ?
Sigo leyendo que hay una diferencia entre los intervalos de confianza (frecuentes) y los intervalos creíbles (bayesianos). Si entendí correctamente, un intervalo creíble diría que hay un 95% de posibilidades de que en nuestra situación el parámetro verdadero esté dentro del intervalo dado (35% -45%), mientras que un intervalo de confianza diría que hay un 95% que en este tipo de situación (pero no necesariamente en nuestra situación específica) el método que estamos utilizando informaría con precisión que el parámetro verdadero está dentro del intervalo dado.
Asumiendo que esta definición es correcta, mi pregunta es: ¿Cuál es el "parámetro verdadero" del que estamos hablando cuando usamos intervalos de confianza creados usando el método bootstrap? ¿Nos referimos a (a) el verdadero parámetro de la población original , o (b) el verdadero parámetro de la muestra ? Si (a), entonces estaríamos diciendo que el 95% de las veces el método bootstrap informará con precisión declaraciones verdaderas sobre la población original. Pero, ¿cómo podríamos saber eso? ¿No descansa todo el método bootstrap en el supuesto?que la muestra original es un reflejo exacto de la población de la que fue tomada? Si (b), entonces no entiendo el significado del intervalo de confianza en absoluto. ¿No sabemos ya el verdadero parámetro de la muestra? ¡Es una medida directa!
Discutí esto con mi maestra y ella fue muy útil. Pero todavía estoy confundido.