¿Cómo evaluar si la media del subgrupo difiere del grupo general que incluye el subgrupo?

9

¿Cómo puedo comprobar si la media (p. Ej., La presión arterial) de un subgrupo (p. Ej., Los que murieron) difiere de todo el grupo (p. Ej., Todos los que tuvieron la enfermedad, incluidos los que murieron)?

Claramente, el primero es un subgrupo del segundo.

¿Qué prueba de hipótesis debo usar?

hypothesis-testing group-differences

— usuario1061210
fuente

¿Estás probando una diferencia de medios?

— Macro

9

Como señala Michael, al comparar un subgrupo con un grupo general, los investigadores generalmente comparan el subgrupo con el subconjunto del grupo general que no incluye el subgrupo.

Piensa en ello de esta manera.

Si es la proporción que murió, y es la proporción que no murió, y $p$ $1-p$

{\bar{X}}_{.} = pag {\bar{X}}_{re} + (1 - pag) {\bar{X}}_{una}

$\bar{X}_. = p\bar{X}_d + (1-p)\bar{X}_a$

donde es la media general, es la media de los que murieron, y es la media de los que todavía están vivos. Entonces $\bar{X}_.$ $\bar{X}_d$ $\bar{X}_a$

si y solo si cuando

{\bar{X}}_{d} \neq {\bar{X}}_{una}

$\bar{X}_d \neq \bar{X}_a$

{\bar{X}}_{re} \neq {\bar{X}}_{.}

$\bar{X}_d \neq \bar{X}_.$

$\Rightarrow$

Supongamos que . Por lo tanto . $\bar{X_{d}}\neq \bar{X_{a}}$ $\bar{X_{.}}\neq p\bar{X_{d}}+(1-p)\bar{X_{d}}=\bar{X_{d}}$

$\Leftarrow$

Supongamos . Por lo tanto, , luego y desde , entonces $\bar{X_{.}}\neq\bar{X_{d}}$ $\bar{X_{d}}\neq p\bar{X_{d}}+(1-p)\bar{X_{a}}$ $(1-p)\bar{X_{d}}\neq (1-p)\bar{X_{a}}$ $(1-p)\neq 0$ . $\bar{X_{d}}\neq \bar{X_{a}}$

Lo mismo puede hacer para las desigualdades.

Por lo tanto, los investigadores generalmente prueban la diferencia entre el subgrupo y el subconjunto del grupo general que no incluye el subgrupo. Esto tiene el efecto de mostrar que el subgrupo difiere del grupo general. También le permite usar métodos convencionales como una prueba t de grupos independientes.

— Jeromy Anglim
fuente

1

{\bar{X}}_{d}

$\overline{X}_d$

{\bar{X}}_{.}

$\overline{X}_{.}$

@Macro buen punto. Gracias. Cambié un poco la redacción a "investigadores típicamente ..."

— Jeromy Anglim

{\bar{X}}_{d}

$\bar{X}_d$

\bar{X}

$\bar{X}$

2

La forma de probar aquí es comparar a aquellos que tuvieron la enfermedad y murieron con aquellos que tuvieron la enfermedad y no murieron. Puede aplicar la prueba t de dos muestras o la prueba de suma de rango de Wilcoxon si no se puede suponer la normalidad.

— Michael R. Chernick
fuente

¿Puedes ser mas específico? ¿Qué tipo de prueba t de dos muestras? prueba t no emparejada? Pensé que para la prueba t, asumes INDEPENDENCIA y NORMALIDAD.

— user1061210

1

Cuando los grupos están separados como sugerimos, las muestras son independientes. La prueba t no estaría emparejada porque los subgrupos no necesitan ser iguales y no existe una forma natural de emparejar las muestras, incluso si los tamaños de las muestras fueran iguales. Mencioné la prueba de Wilcoxon porque la suposición de normalidad puede no ser válida y la prueba de Wilcoxon no requiere normalidad.

— Michael R. Chernick

0

Lo que debe hacer es evaluar las proporciones de la población (tamaño de muestra grande). Las estadísticas que involucran la proporción de la población a menudo tienen un tamaño de muestra que es grande (n => 30), por lo tanto, la distribución de aproximación normal y las estadísticas asociadas se utilizan para determinar una prueba para determinar si la proporción de la muestra (presión arterial de los fallecidos) = proporción de la población (todos quién tenía la enfermedad, incluidos los que murieron).

Es decir, cuando el tamaño de la muestra es mayor o igual a 30, podemos usar las estadísticas del puntaje z para comparar la proporción de la muestra con la proporción de la población usando el valor de la desviación estándar de la muestra p-hat, para estimar la desviación estándar de la muestra, p si no se sabe

La distribución muestral de P (proporción) es aproximadamente normal con un valor medio o esperado, E (P) = p-hat y error estándar, sigma (r) = sqrt (p * q / n).

Las siguientes son las posibles preguntas de hipótesis de prueba que uno puede hacer al comparar dos proporciones:

(Prueba de dos colas)

H0: p-hat = p vs H1: p-hat no es igual a p

(Prueba de cola derecha)

H0: p-hat = p vs H1: p-hat> p

(Prueba de cola izquierda)

H0: p-hat = p vs H1: p-hat <p

Las estadísticas utilizadas para evaluar el tamaño de muestra grande son;

Las estadísticas de prueba están relacionadas con la distribución normal estándar:

Las estadísticas de puntuación z para proporciones

p-hat-p / sqrt (pq / n)

, donde p = proporción estimada, q = 1-p y es la proporción de la población.

La media de la proporción es:

np / n = p-hat = x / n

Desviación Estándar:

= sqrt (npq / n) = sqrt (pq / n)

Reglas de decisión:

Prueba de cola superior (): (H0: P-hat> = P)

Acepte H0 si Z <= Z (1-alfa)

Rechace H0 si Z> Z (1-alfa)

Prueba de cola inferior (Ha: P-hat <= P):

Acepte H0 si Z> = Z (1-alfa)

Rechace H0 si Z

Prueba de dos colas (Ha: P-hat no es igual a P):

Acepte H0 si Z (alfa / 2) <= Z <= Z (1-alfa / 2)

Rechace H0 si Z <Z (alfa / 2) o si Z> Z (1-alfa / 2)

— Chiemeka Ezeogu
fuente