Buscando el 'codo' en los datos

8

La subitización es la enumeración rápida y precisa de las pantallas de baja numerosidad, que se distingue del conteo por una no linealidad aguda en la gráfica de tiempos de respuesta. A continuación se muestra una trama representativa, de Watson, DG, Maylor, EA y Bruce, LAM (2007). Observe que los tiempos de enumeración medios para las pantallas 1-3 aumentan de forma lineal, pero el tiempo de enumeración medio para 4 no sigue la tendencia lineal. Algunas investigaciones sugieren que el 'límite' de subitización depende de las condiciones de la tarea y la memoria de trabajo de los participantes.

ingrese la descripción de la imagen aquí

Estoy buscando una forma de probar dónde está el codo, con el objetivo final de identificar cuál es el límite de subitización de un participante. Actualmente, mi mejor idea es hacer algo como contrastes polinómicos repetidos. Básicamente, probaría una tendencia cuadrática en numerosities 1-3, luego en numerosities 1-4, etc. Me gustaría decir que he superado el límite de subitización cuando la tendencia cuadrática se vuelve significativa (ajuste para pruebas repetidas).

Sin embargo, se trata de los límites de mi conocimiento estadístico, por lo que no puedo evaluar esta idea demasiado bien. Pensamientos?

Gracias por adelantado.

linear-model contrasts

— Nathan
fuente

3

Dependiendo de su definición del "codo", hay muchas pruebas estadísticas a su disposición. Con un paquete completo de R dedicado a este tema.

Yo personalmente tiendo a evitarlos, ya que nunca se sabe de antemano qué considerarán un "codo" y si sus opiniones coincidirán. (pero esto podría considerarse una posición extrema) También dependería de si desea saber si hay un "codo" en una ubicación específica, o si desea preguntar si hay uno en general.

Para el caso de una ubicación específica, por supuesto, puede ajustar una regresión local, comparar los coeficientes y declarar un codo de acuerdo con su propia regla sobre la diferencia en las pendientes.

El verdadero problema ocurre en el último caso. Si solo tiene un par de puntos, puede probarlos todos. De lo contrario, ajustaría algo no paramétrico como LOESS, calcule el gradiente de la línea a intervalos regulares (con suficiente densidad), como se muestra aquí: /programming/12183137/calculate-min-max- pendiente-de-loess-ajustada-curva-con-r

y use nuevamente alguna regla que le resulte conveniente para declarar algo como un "codo". Veo el "codo" como el caso cuando ocurre un cambio lo suficientemente grande de gradiente de una función en un intervalo lo suficientemente corto. Por supuesto, los umbrales para las reglas anteriores son una cuestión de gusto individual, por lo que no hay prueba.

En general, supongo que esto sería bastante inútil si los datos son ondulados (ya que habría muchos cambios en el gradiente).

— significado
fuente

Le ruego que difiera: hay muchas pruebas estadísticas para el "codo", siempre que esté definido con suficiente claridad. Este es un ejemplo de un punto de cambio o un problema de cambio estructural .

— whuber

1

Probablemente debería reformular, la respuesta entonces. Mi punto era exactamente que el quid está en la definición del "codo". Además, tiendo a no confiar en la aplicación de algún procedimiento de punto de cambio a los datos (series temporales), ya que nunca sé cuánto difiere la definición de los autores del "codo" de la mía. Por lo tanto, abogaba por crear una regla personal para identificar el "codo", en lugar de utilizar algunas de las herramientas de estantería. Es posible que no tenga una prueba estadística, pero al menos si la crea, sabe lo que hace y cómo tiende a etiquetar las curvas.

— significado del

+1 Es un muy buen punto.

— whuber

0

Para el ejemplo proporcionado, un método simple sería aplicar un algoritmo de suavizado y luego hacer la segunda derivada como se muestra en mi respuesta a esta otra pregunta.

— GuillaumeL
fuente