Los datos de arrestos de EE. UU. Agrupados con R son solo un ejemplo aquí, pero observo que los cálculos de carga en la pregunta provienen de un PCA de la matriz de covarianza . Eso es algo entre arbitrario y sin sentido, ya que las variables se miden en diferentes escalas.
La población urbana parece un porcentaje. California es 91% y más alto.
Las tres variables delictivas parecen ser el número de arrestos por delitos expresados en relación con el tamaño de la población (presumiblemente por algún período de tiempo). Presumiblemente está documentado en alguna parte, ya sea arrestos por 1000 o 10000 o lo que sea.
La media de la variable de asalto en las unidades dadas es de aproximadamente 171 y la media del asesinato es de aproximadamente 8. Entonces, la explicación de sus cargas es que en gran parte el patrón es un artefacto: depende de la variabilidad muy diferente de las variables.
Entonces, aunque tiene sentido en los datos que hay muchos más arrestos por asaltos que por asesinatos, etc., ese hecho conocido (o no sorprendente) domina el análisis.
Esto muestra que, como en cualquier otro lugar de las estadísticas, debe pensar en lo que está haciendo en un PCA.
Si lleva esto más lejos:
Yo diría que es mejor dejar de lado el porcentaje urbano del análisis. No es un crimen ser urbano; Por supuesto, podría servir como proxy de variables que influyen en la delincuencia.
Un PCA basado en una matriz de correlación tendría más sentido en mi opinión. Otra posibilidad es trabajar con logaritmos de tasas de arresto, no tasas de arresto (todos los valores son positivos; ver más abajo).
Nota: la respuesta de @ random_guy usa deliberadamente la matriz de covarianza.
Aquí hay algunas estadísticas resumidas. Usé Stata, pero eso es bastante irrelevante.
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
urban_pop | 50 65.54 14.47476 32 91
murder | 50 7.788 4.35551 .8 17.4
rape | 50 21.232 9.366384 7.3 46
assault | 50 170.76 83.33766 45 337