Consideremos dos variables (Xi, Yi) Cuando dices bin los datos, y "bin" enXi, ¿quieres decir repetir la medición exactamente igual? Xi para obtener el correspondiente Y′i¿valor? Si repite la medición de esta manera, el error en el promedio disminuirá conn−−√, y creo que eres libre de hacer lo que quieras con él. Solo asegúrese de utilizar un coeficiente de correlación ponderado si considera los puntos de datos con barras de error muy diferentes.
Ahora déjenos decir que no está repitiendo la medición de Xi, pero considerando Xi±δ y el correspondiente Yi±δ′ y binning en δ y obtener valores agrupados en δ. Creo que en esta situación la solución dependerá de la relación entre el tamaño del contenedor, el error en la medición y la pendiente de la correlación. Espero que si ambosδy son pequeños, la situación será similar a la del párrafo anterior. De lo contrario, podría ser ventajoso bin o no; cambiará los resultados porque el cov ( , ) será diferente del de los valores no enlazados, pero creo que todavía es válido hacerlo. Creo que no estás rompiendo ninguna suposición; Solo me aseguraría de que sea ventajoso hacerlo, y probaría su importancia a través de una prueba de permutación (para evitar hacer una suposición sobre la distribución del coeficiente).δ´Xi,binYi,bin