Tenga en cuenta primero que @Nick Stauner presenta algunos argumentos muy importantes con respecto a la detención opcional . Si prueba repetidamente los datos a medida que llegan las muestras, se detiene una vez que una prueba es significativa, pero tiene garantizado un resultado significativo. Sin embargo, un resultado garantizado es prácticamente inútil.
A continuación, presentaré mis mejores intentos para elaborar una posición deductivista, escéptica y falsacionista. Ciertamente no es el único, pero creo que es bastante convencional, o al menos uno con un poco de tradición.
Según tengo entendido, Fisher introdujo originalmente pruebas de significación como un primer paso en la exploración de datos: establezca qué factores podrían valer la pena investigar más a fondo. A menos que la hipótesis nula que haya puesto a prueba en realidad fuera la hipótesis crítica de la que dependía su teoría favorita (improbable), en cierto modo, su prueba inicial fue de naturaleza bastante exploratoria. Entre los posibles pasos que siguen a la exploración, veo
- Exploración adicional
- Estimación de Parámetros
- Predicción y Confirmación
La exploración adicional consiste en pruebas de seguimiento en las que intenta inferir si alguna variable sobre la que tiene información es moderada o interactúa con su efecto. Por ejemplo, ¿quizás la edad de los participantes juega un papel? Tenga en cuenta que dichos análisis deben estar claramente etiquetados como exploratorios, o básicamente equivalen a mentiras. Si tropieza con algo, primero requiere confirmación. En general, siempre debe ser claro, tanto en sus pensamientos como en sus escritos, sobre cuándo está trabajando en forma exploratoria y cuando es confirmatorio.
Luego, una vez que haya establecido que no tiene confianza en que el valor de un parámetro sea exactamente cero, una vez que haya decidido que por ahora considerará que el factor bajo prueba tiene alguna influencia, un próximo paso factible podría ser estimar aún más el valor preciso del parámetro . Por ejemplo, por ahora, solo ha excluido un valor, 0 (suponiendo una prueba de dos lados). Sin embargo, sus datos también ponen en duda muchos otros valores posibles.
αα
Hume argumentó que nunca podemos probar inductivamente una afirmación correcta. En general, las hipótesis no triviales son siempre mucho más fáciles de falsificar que de apoyar; ser fácil de falsificar en principio (al no ser trivial, hacer predicciones precisas), pero no ser falsificado hasta ahora es, de hecho, una de las mayores virtudes de una teoría.
Por lo tanto, un CI no lo llevará a probar un valor específico. Sin embargo, reduce el conjunto de candidatos. Tal vez los únicos candidatos que quedan vivos lo ayuden a decidir entre dos teorías, ambas incompatibles con H0. Por ejemplo, tal vez 0 esté excluido, pero la teoría 1 predice un valor alrededor de 5, y la teoría 2 predice un valor alrededor de 15. Si su IC del 95% incluye 5, pero excluye 15, ahora también ha perdido la confianza en la teoría 2, pero la teoría Queda 1 en el juego. Tenga en cuenta que esto es realmente independiente de que su prueba inicial sea significativa, incluso si 0 está entre los valores no rechazados, muchos valores serán rechazados. Quizás para algunos otros investigadores, algunos de estos valores fueron de interés.
Una vez que haya especificado su comprensión del efecto en cuestión, lo ideal sería hacer una predicción más precisa para un experimento confirmatorio de seguimiento que apunte a probar una hipótesis más precisa que pueda derivar de su análisis actual. Es cierto que rechazar su hipótesis nula estadística inicial no fue una prueba tan severa de su hipótesis de investigación original , ¿no? Muchas más explicaciones que la que prefiere no dependen de H0. Además, como nunca estuvo en peligro de aceptar H0, ¡no estaba en posición de falsificar su teoría favorita! Entonces necesitas una prueba más severa. Posiblemente, esto es realmente lo que quieres; no quieres probar tu teoría, quieres someterla a pruebas cada vez más severas, intentando falsificarla. Soportar tales esfuerzos genuinos (pero justos) para refutarlo es lo mejor que puede ofrecer una teoría. Pero para una prueba severa, necesita una teoría más precisa que "0 no es".
Ahora ha aprendido múltiples hechos importantes sobre un estudio confirmatorio; por ejemplo, tiene una idea de la varianza y la magnitud del efecto en cuestión, lo que le permite estimar el tamaño de muestra requerido para un estudio de seguimiento mediante análisis de potencia. También puede predecir un valor específico y asumir una región de equivalencia práctica / CUERDA a su alrededor. Nunca podrá probar que este valor específico es el verdadero valor; sin embargo, si el CI de un experimento de seguimiento cae completamente dentro de su CUERDA, tiene evidencia que corrobora su teoría (y posiblemente trajo problemas a la competencia).