Supongamos que tengo una muestra de la distribución conjunta de X y Y . ¿Cómo pruebo la hipótesis de que X e Y son independientes? ?
No se hace suposición sobre las leyes de distribución conjunta o marginal de e Y (por lo menos de toda la normalidad conjunta, ya que en ese caso la independencia es idéntica a la correlación siendo 0 ).
No se asume la naturaleza de una posible relación entre e Y ; puede ser no lineal, por lo que las variables no están correlacionadas ( r = 0 ) pero son altamente co-dependientes ( I = H ).
Puedo ver dos enfoques:
Bin tanto las variables y el uso la prueba exacta de Fisher o G-test .
- Pro: use pruebas estadísticas bien establecidas
- Con: depende de binning
Estime la dependencia de e Y : I ( X ; Y ) (esto esparaXeYindependientesy1cuando se determinan por completo).
- Pro: produce un número con un claro significado teórico
- Con: depende del cálculo aproximado de entropía (es decir, binning nuevamente)
¿Tienen sentido estos enfoques?
¿Qué otros métodos usan las personas?