He realizado un experimento en el que he recogido medidas de varios participantes. Cada punto de datos relevante tiene dos variables, ambas categóricas: de hecho, cada variable tiene dos valores posibles (respuestas a dos preguntas sí / no). Me gustaría una prueba de hipótesis estadística para verificar si parece haber una correlación entre estas dos variables.
Si tuviera un punto de datos por participante, podría usar la prueba exacta de Fisher en el resultado mesa de contingencia. Sin embargo, tengo múltiples puntos de datos por participante. En consecuencia, la prueba exacta de Fisher no parece aplicable, porque los puntos de datos de un solo participante no son independientes. Por ejemplo, si tengo 10 puntos de datos de Alice, probablemente no sean independientes, porque todos provienen de la misma persona. La prueba exacta de Fisher supone que todos los puntos de datos se muestrearon de forma independiente, por lo que las suposiciones de la prueba exacta de Fisher no se cumplen y sería inapropiado usar en este entorno (podría dar informes injustificados de significancia estadística).
¿Existen técnicas para manejar esta situación?
Enfoques que he considerado:
Una alternativa plausible es agregar todos los datos de cada participante en un solo número y luego usar alguna otra prueba de independencia. Por ejemplo, para cada participante, podría contar la fracción de respuestas de Sí a la primera pregunta y la fracción de respuestas de Sí a la segunda pregunta, dándome dos números reales por participante, y luego usar la prueba de momento del producto de Pearson para evaluar la correlación entre estos dos números Sin embargo, no estoy seguro de si este es un buen enfoque. (Por ejemplo, me preocupa que promediar / contar esté arrojando datos y esto podría estar perdiendo potencia, debido a la agregación; o que los signos de dependencia podrían desaparecer después de la agregación).
He leído acerca de los modelos de varios niveles, que parecen estar destinados a manejar esta situación cuando las variables subyacentes son continuas (por ejemplo, números reales) y cuando un modelo lineal es apropiado. Sin embargo, aquí tengo dos variables categóricas (respuestas a las preguntas Sí / No), por lo que no parecen aplicarse aquí. ¿Existe alguna técnica equivalente que sea aplicable a los datos categóricos?
También he leído un poco sobre el diseño de medidas repetidas en Wikipedia, pero el artículo de Wikipedia se centra en estudios longitudinales. Eso no parece aplicable aquí: si lo entiendo correctamente, las medidas repetidas parecen centrarse en los efectos debido al paso del tiempo (donde la progresión del tiempo influye en las variables). Sin embargo, en mi caso, el paso del tiempo no debería tener ningún efecto relevante. Dime si he entendido mal.
En una reflexión posterior, otro enfoque que se me ocurre es usar una prueba de permutación. Para cada participante, podríamos permutar aleatoriamente sus respuestas a la pregunta 1 y (independientemente) permutar aleatoriamente sus respuestas a la pregunta 2, utilizando una permutación diferente para cada participante. Sin embargo, no me queda claro qué estadístico de prueba sería apropiado aquí, para medir qué resultados son "al menos tan extremos" como el resultado observado.
Relacionado: Cómo tratar correctamente múltiples puntos de datos por cada sujeto (pero eso también se enfoca en modelos lineales para variables continuas, no en datos categóricos). ¿Son independientes las mediciones en el mismo paciente? (mismo)