Estoy estudiando las perturbaciones causadas por el tráfico de barcos a una pequeña ave marina. Observé animales focales durante un período de tiempo determinado y registré si volaban o no desde el agua durante la observación. Esta ave en particular no vuela con altas probabilidades cuando no es molestada (aproximadamente el 10% del tiempo). Post hoc, he agregado la distancia al barco más cercano a cada observación (los barcos de interés tenían localizadores GPS que registraban un punto cada 5 segundos).
He trazado la función de distribución acumulativa para TODAS las observaciones y para las observaciones en las que el pájaro voló desde el agua en función de la distancia al barco más cercano. Como se esperaba, la mayoría de las observaciones en las que voló el pájaro se observaron cuando el barco estaba cerca.
¿Puedo usar la prueba de Kolmogorov-Smirnov para probar si hay una diferencia estadística en la distribución de las observaciones de vuelo y las observaciones totales? Mi pensamiento es que si estas dos distribuciones son diferentes, sugeriría que la distancia del barco influye en el vuelo. Me preocupa, ya que estas funciones de distribución no son independientes, ya que las observaciones de vuelo son un subconjunto de las observaciones totales.
Pensamientos?
Después de leer un poco más en este sitio, creo que puedo probar la distribución de las observaciones en las que se produjo el vuelo (F) contra la distribución de las observaciones en las que no ocurrió (NF), ya que son independientes. Si estas distribuciones son las mismas F = NF, entonces podemos suponer que la distribución de (F) y (TOT = todas las observaciones) son las mismas, ya que sabemos que la distribución de (F) es igual a sí misma y (F) + (T) = (TOT). ¿Derecha?
ACTUALIZACIÓN: 2/12/14
Siguiendo las sugerencias de @Scortchi, investigué la relación de la incidencia de vuelo vs distancia al barco más cercano en un marco de regresión logística. Hubo una ligera relación presente (pendiente negativa) pero el valor p no fue significativo, lo que sugiere que la pendiente verdadera podría ser cero. Con base en las estadísticas descriptivas (incluidas las parcelas ecdf) sospeché que el efecto de los barcos cercanos se estaba ahogando por las muchas observaciones cuando el barco no estaba afectando el comportamiento. Luego usé el paquete R segmentado ( http://cran.r-project.org/web/packages/segmented/segmented.pdf) para tratar de encontrar un punto de quiebre en el modelo. El programa descubrió que romper los datos a 2.6 km del barco y ajustar dos coeficientes separados era mejor que el modelo de coeficiente único. El coeficiente para la pendiente de las aproximaciones de barcos cercanos fue negativo y sugiere que los barcos afectan la respuesta de vuelo hasta aproximadamente 2.6 km (valor p <0.001). El coeficiente para la segunda pendiente fue ligeramente positivo, pero el valor p no fue significativo en el nivel alfa de 0.05 (valor p = 0.11). En resumen, la línea de regresión segmentada pudo detectar una diferencia de umbral a la que aumenta la probabilidad de vuelo. La estimación de la probabilidad de vuelo cuando el barco está más allá de 2.6 km es 0.11. Oportunamente, observé 79 aves cuando ni siquiera había barcos en la bahía de estudio (>
Gracias por todas las sugerencias. Espero que esta pregunta junto con las sugerencias y respuestas ayude a otros.