Investigo sobre juegos educativos, y algunos de mis proyectos actuales implican el uso de datos de BoardGameGeek (BGG) y VideoGameGeek (VGG) para examinar las relaciones entre los elementos de diseño de los juegos (es decir, "ambientado en la Segunda Guerra Mundial", "implica lanzar dados" ) y calificaciones de jugadores de esos juegos (es decir, puntajes de 10). Cada uno de estos elementos de diseño corresponde con una etiqueta en el sistema BGG o VGG, por lo que cada elemento es esencialmente una variable dicotómica. Un juego tiene un 1 para cada etiqueta que está presente en la base de datos, y un 0 para cada etiqueta que no está presente.
Hay docenas de estas etiquetas, por lo que quiero usar el análisis factorial exploratorio (EFA) para obtener una cantidad manejable de "géneros" que capturen patrones en el diseño del juego. Consultar varias fuentes, entiendo que ya que estoy trabajando con dicotómicas las variables, que debería utilizar policóricas correlaciones ( tetracóricas , sobre todo aquí) en lugar de Pearson queridos cuando sube con mis factores (hay también otras opciones como rasgo latente son análisis- por ahí, pero este es el que estoy explorando por ahora).
Por curiosidad, se me ocurrieron dos conjuntos de factores, uno con correlaciones de Pearson y el otro con correlaciones policóricas (el mismo número de factores cada vez). Mi problema es que los factores calculados usando las correlaciones de Pearson tienen mucho más sentido y son más fáciles de interpretar que los factores calculados usando correlaciones policóricas. En otras palabras, los "géneros" del primer conjunto de factores tienen sentido intuitivo y se corresponden con mi comprensión de cómo se diseñan típicamente los juegos; ese no es el caso para el segundo conjunto de factores.
Por un lado, quiero asegurarme de cumplir con los supuestos de las pruebas que estoy utilizando, incluso si eso hace que mis resultados sean menos bonitos. Por otro lado, creo que parte del objetivo del análisis factorial y (más ampliamente) la construcción de modelos es encontrar algo útil, y la información más útil emerge cuando estoy "rompiendo las reglas". ¿Es la necesidad de un modelo útil suficiente para superar las violaciones de los supuestos de esta prueba? ¿Cuáles son exactamente las consecuencias de usar las correlaciones de Pearson en lugar de las policoróricas?