Me especializo en ciencias, y mi conocimiento de estadística es bastante superficial.
Problema
Tenía que encontrar un conjunto de datos y analizarlo lo mejor que pudiera como asignación para mi curso de estadística. Esto ya no es una tarea, solo necesito ayuda para interpretar por qué hice mal mi análisis y qué debería haber hecho en su lugar.
Utilicé un conjunto de datos categóricos de las tasas de empleo en Nueva Zelanda, planeando organizarlo en una tabla de contingencia 2x2 y utilicé la prueba de chi-cuadrado de Pearson y la prueba exacta de Fisher para evaluar si el género se correlaciona con el empleo.
Lo que quiero responder
- Entienda por qué no puedo usar la prueba de ji cuadrado y la prueba exacta de Fisher para este problema y aprenda lo que debería haber usado en su lugar. ¿"Odds-ratio en función del tiempo", supongo? ¿Algún enlace útil sobre cómo hacerlo perfectamente en R?
- Comprenda el comentario de "correlación secuencial" con respecto a la primera parte de la tarea y qué es exactamente lo que debería haber hecho.
Manera de ayudarme # 1 (más corto)
Así es como se ven nuestros datos (basados en un censo):
Male Female
Employed 1201600 1060200
Unemployed 73300 75000
Hice una prueba de ji cuadrado y una prueba exacta de Fisher en R, suponiendo que el valor p obtenido me dirá la probabilidad de tal distribución de trabajos (o un extremo más) dado que el nulo es verdadero (que hombres y mujeres tienen las mismas posibilidades de conseguir un trabajo). Obtuve un valor p muy pequeño, y la prueba de Fisher me dio una razón de posibilidades de 1.16, lo que significa que existe una correlación, y específicamente los hombres tienen un 16% más de probabilidades de encontrar trabajo en Nueva Zelanda.
Sin embargo, según mi profesor, usé estas pruebas de manera inapropiada. No entendí bien por qué, pero creo que estaba diciendo que estas pruebas suponen independencia, y debido a que hay una cantidad determinada de trabajos disponibles en Nueva Zelanda, nuestras muestras no son independientes ... Sin embargo, no estoy seguro de eso (usted puede ver sus comentarios citados a continuación).
Manera de ayudarme # 2 (más tiempo)
Si tienes algo de tiempo libre, te agradecería mucho que pudieras ver toda la tarea. También proporcionaré los comentarios del profesor, por lo que si pudiera interpretarlo para mí, ¡sería genial! La tarea es muy fácil para un matemático / estadístico, solo hay dos preguntas allí, solo está llena de relleno donde traté de demostrar que sé lo que estoy haciendo, puedes saltarte la mayor parte.
Aquí está el enlace a un archivo PDF con la tarea en la que no tuve éxito: estadísticas de asignación.pdf .
Comentarios del profesor
Su figura 1 exhibe correlación secuencial, que es la verdadera razón por la cual la regresión lineal no funciona. Ni la prueba de pescador ni el chi cuadrado son buenos para su tabla de 2x2. Esto se debe a que desea probar la homogeneidad, pero está rechazando el valor nulo por falta de independencia (lo cual no es interesante). La distinción entre los dos es irrelevante aquí (son asintóticamente idénticos en cualquier caso). Podría haber trazado la razón de posibilidades en función del tiempo.