¿Calculando la confiabilidad entre evaluadores en R con un número variable de clasificaciones?

Wikipedia sugiere que una forma de ver la confiabilidad entre evaluadores es usar un modelo de efectos aleatorios para calcular la correlación intraclase . El ejemplo de correlación intraclase habla de mirar

\frac{σ_{α}^{2}}{σ_{α}^{2} + σ_{ϵ}^{2}}

$\frac{\sigma_\alpha^2}{\sigma_\alpha^2+\sigma_\epsilon^2}$

de un modelo

Y_{yo j} = μ + α_{yo} + ϵ_{yo j}

$Y_{ij} = \mu + \alpha_i + \epsilon_{ij}$

"donde Y _ij es el j ^ésimo observación en el i ^ésimo grupo, μ es una media global no observada, α _i es un efecto aleatorio no observada compartida por todos los valores en el grupo I, y varepsilon _ij es un término de ruido no observada."

Este es un modelo atractivo, especialmente porque en mis datos ningún evaluador ha calificado todas las cosas (aunque la mayoría ha calificado con más de 20), y las cosas tienen una cantidad variable de veces (generalmente 3-4).

Pregunta # 0: ¿Es el "grupo i" en ese ejemplo ("grupo i") una agrupación de cosas que están siendo calificadas?

Pregunta n. ° 1: Si estoy buscando confiabilidad entre evaluadores, ¿no necesito un modelo de efectos aleatorios con dos términos, uno para el evaluador y otro para la cosa calificada? Después de todo, ambos tienen una posible variación.

Pregunta # 2: ¿Cómo expresaría mejor este modelo en R?

Parece que esta pregunta tiene una propuesta atractiva:

lmer(measurement ~ 1 + (1 | subject) + (1 | site), mydata)

Miré un par de preguntas , y la sintaxis del parámetro "aleatorio" para lme es opaca para mí. Leí la página de ayuda de lme , pero la descripción de "aleatorio" es incomprensible para mí sin ejemplos.

Esta pregunta es algo similar a una larga lista de preguntas , siendo esta la más cercana. Sin embargo, la mayoría no aborda R en detalle.

r reliability random-effects-model agreement-statistics

— dfrankow
fuente

El modelo de efectos mixtos y los de efectos aleatorios se codifican de la misma manera en R. ¡Consulte ncbi.nlm.nih.gov/pmc/articles/PMC3402032 para obtener más información sobre el tuto!

— noé

El modelo al que hizo referencia en su pregunta se llama "modelo unidireccional". Se supone que los efectos de fila aleatorios son la única fuente sistemática de variación. En el caso de la confiabilidad entre evaluadores, las filas corresponden a objetos de medición (p. Ej., Sujetos).

$x_{i j} = μ + r_{i} + w_{i j}$ $x_{ij} = \mu + r_i + w_{ij}$ $\mu$ $r_i$ $w_{ij}$

Sin embargo, también hay "modelos de dos vías". Estos suponen que hay una variación asociada con los efectos de fila aleatorios, así como los efectos de columna aleatorios o fijos. En el caso de la fiabilidad entre evaluadores, las columnas corresponden a las fuentes de medición (p. Ej., Evaluadores).

$x_{i j} = μ + r_{i} + c_{j} + r c_{i j} + e_{i j}$ $x_{ij} = \mu + r_i + c_j + rc_{ij} + e_{ij}$ $x_{i j} = μ + r_{i} + c_{j} + e_{i j}$ $x_{ij} = \mu + r_i + c_j + e_{ij}$ $\mu$ $r_i$ $c_j$ $rc_{ij}$ $e_{ij}$

$x_{ij}$ $\bar{x}_i$

Estas son las definiciones si asume un efecto de columna aleatorio:

$yo C C (C, 1) = \frac{σ_{r}^{2}}{σ_{r}^{2} + (σ_{r C}^{2} + σ_{mi}^{2})} o \frac{σ_{r}^{2}}{σ_{r}^{2} + σ_{mi}^{2}}$ $ICC(C,1) = \frac{\sigma_r^2}{\sigma_r^2 + (\sigma_{rc}^2 + \sigma_e^2)}\text{ or }\frac{\sigma_r^2}{\sigma_r^2 + \sigma_e^2}$ $yo C C (C, k) = \frac{σ_{r}^{2}}{σ_{r}^{2} + (σ_{r C}^{2} + σ_{mi}^{2}) / / k} o \frac{σ_{r}^{2}}{σ_{r}^{2} + σ_{mi}^{2} / / k}$ $ICC(C,k) = \frac{\sigma_r^2}{\sigma_r^2 + (\sigma_{rc}^2 + \sigma_e^2)/k}\text{ or }\frac{\sigma_r^2}{\sigma_r^2 + \sigma_e^2/k}$ $yo C C (UNA, 1) = \frac{σ_{r}^{2}}{σ_{r}^{2} + (σ_{C}^{2} + σ_{r C}^{2} + σ_{mi}^{2})} o \frac{σ_{r}^{2}}{σ_{r}^{2} + (σ_{C}^{2} + σ_{mi}^{2})}$ $ICC(A,1) = \frac{\sigma_r^2}{\sigma_r^2 + (\sigma_c^2 + \sigma_{rc}^2 + \sigma_e^2)}\text{ or }\frac{\sigma_r^2}{\sigma_r^2 + (\sigma_c^2 + \sigma_e^2)}$ $yo C C (UNA, k) = \frac{σ_{r}^{2}}{σ_{r}^{2} + (σ_{C}^{2} + σ_{r C}^{2} + σ_{mi}^{2}) / / k} o \frac{σ_{r}^{2}}{σ_{r}^{2} + (σ_{C}^{2} + σ_{mi}^{2}) / / k}$ $ICC(A,k) = \frac{\sigma_r^2}{\sigma_r^2 + (\sigma_c^2 + \sigma_{rc}^2 + \sigma_e^2)/k}\text{ or }\frac{\sigma_r^2}{\sigma_r^2 + (\sigma_c^2 + \sigma_e^2)/k}$

También puede estimar estos valores utilizando cuadrados medios de ANOVA:

$yo C C (C, 1) = \frac{METRO S_{R} - METRO S_{mi}}{METRO S_{R} + (k - 1) METRO S_{mi}}$ $ICC(C,1) = \frac{MS_R - MS_E}{MS_R + (k-1)MS_E}$ $yo C C (C, k) = \frac{METRO S_{R} - METRO S_{mi}}{METRO S_{R}}$ $ICC(C,k) = \frac{MS_R-MS_E}{MS_R}$ $yo C C (UNA, 1) = \frac{METRO S_{R} - METRO S_{mi}}{METRO S_{R} + (k - 1) METRO S_{mi} + k / / norte (METRO S_{C} - METRO S_{mi})}$ $ICC(A,1) = \frac{MS_R-MS_E}{MS_R + (k-1)MS_E + k/n(MS_C-MS_E)}$ $yo C C (UNA, k) = \frac{METRO S_{R} - METRO S_{mi}}{METRO S_{R} + (METRO S_{C} - METRO S_{mi}) / / norte}$ $ICC(A,k) = \frac{MS_R-MS_E}{MS_R + (MS_C-MS_E)/n}$

Puede calcular estos coeficientes en R usando el paquete irr :

icc(ratings, model = c("oneway", "twoway"),
type = c("consistency", "agreement"),
unit = c("single", "average"), r0 = 0, conf.level = 0.95)

Referencias

McGraw, KO y Wong, SP (1996). La formación de inferencias sobre algunos coeficientes de correlación intraclase. Métodos psicológicos, 1 (1), 30–46.

Shrout, PE y Fleiss, JL (1979). Correlaciones intraclase: usos en la evaluación de la confiabilidad del evaluador. Boletín psicológico, 86 (2), 420-428.

— Jeffrey Girard
fuente

¡Gracias por la gran respuesta! En un modelo de dos vías dentro de icc en R, ¿cómo representamos la selección aleatoria de evaluadores por fila? Quiero decir, imagina que tenemos un grupo de 100 evaluadores, y cada sujeto está calificado por alrededor de 5-10 de ellos. ¿Puede tal escenario ser manejado por el paquete icc?

— michal

Cada evaluador debe tener su propia columna en la matriz que alimenta a la función icc. De lo contrario, el cálculo es el mismo para los modelos de efectos aleatorios y mixtos: la principal diferencia está en la interpretación (qué tan generalizables pueden considerarse los resultados).

— Jeffrey Girard

¡Gracias por la respuesta! Estoy tratando de hacer eso, teniendo principalmente NA en las celdas (y solo unos pocos valores con números reales por columna, donde un evaluador en particular calificó un tema correspondiente a una fila). Sin embargo, en la salida recibo un texto que dice que no se registraron sujetos (por ejemplo, Sujetos = 0 Calificadores = 9). ¿Quizás significa que donde se encontró al menos un NA se filtra toda la fila? Pero entonces, ¿cómo puedo denotar calificaciones faltantes de un evaluador?

— michal

Hmm eso puede ser una limitación de esta función icc específica. Tengo un script MATLAB que puede manejar esta situación. ¿Tienes acceso a MATLAB?

— Jeffrey Girard

Sí, mira

— Jeffrey Girard