Primero, es solo una broma y es incorrecta. Google tiene muchos estadísticos muy talentosos, expertos en recuperación de información, lingüistas, economistas, algunos psicólogos y otros. Estas personas pasan mucho tiempo educando a muchos no estadísticos sobre la diferencia entre correlación y causalidad. Dado que es una organización grande, puede haber bolsillos, incluso grandes bolsillos, de ignorancia, pero la afirmación es definitivamente falsa. Además, gran parte de esa educación se enfrenta a los clientes, especialmente a los anunciantes.
Respuesta más profunda: la diferencia es extremadamente importante. Solo mire la clasificación de los resultados de búsqueda y permítame extenderme más allá de la "correlación" para incluir medidas de similitud, funciones de puntuación, etc. Algunas páginas se miden como buenos resultados para ciertas consultas. Estos tienen una variedad de características predictoras que son importantes para su clasificación. En contraste con estas buenas páginas que son buenos resultados para las consultas, hay un conjunto de páginas web que son páginas que son muy malos resultados para las mismas consultas. Sin embargo, los creadores de esas páginas gastan mucho esfuerzo para que se vean como buenas páginas desde un punto de vista numérico, como coincidencias de texto, enlaces de Internet y más. Sin embargo, el hecho de que estas páginas sean numéricamente "similares" a buenas páginas no significa que, de hecho, sean buenas páginas. Por lo tanto, Google ha invertido y continuará invirtiendo mucho esfuerzo para determinar qué características razonables distinguen (separan) las páginas buenas y las malas.
Esto no es correlación y causalidad, pero es más profundo que eso. Las páginas buenas para ciertas consultas pueden mapearse en un espacio numérico donde parecen similares y distintas de muchas páginas irrelevantes o malas, pero el hecho de que los resultados estén en la misma región del espacio de características no implica que provengan del mismo subconjunto de "alta calidad" de la web.
Respuesta más simple: una perspectiva muy simple es abordar la clasificación de los resultados. El mejor resultado debe ser el primero, pero el hecho de que algo se clasifique primero no significa que sea el mejor resultado. Según algunas métricas de puntuación, puede encontrar que la clasificación de Google está correlacionada con un estándar de oro de evaluaciones de calidad, pero eso no significa que su clasificación implique que los resultados están realmente en este orden en términos de calidad y relevancia.
Actualización (tercera respuesta): con el tiempo, hay otro aspecto que nos afecta a todos: es que el resultado superior de Google puede considerarse autoritario, porque es el resultado superior en Google. Aunque el análisis de enlaces (p. Ej., "PageRank", un método para el análisis de enlaces) es un intento de reflejar la autoridad percibida, con el tiempo las nuevas páginas sobre un tema pueden simplemente reforzar esa estructura de enlaces al enlazar al resultado superior en Google. Una página más nueva que tiene más autoridad tiene un problema con el inicio en relación con el primer resultado. Como Google quiere entregar la página más relevante en la actualidad , surgen una variedad de factores, incluido el llamado fenómeno de "enriquecerse para enriquecerse" debido a un efecto implícito de correlación en la causalidad percibida.
Actualización (cuarta respuesta): me di cuenta (para un comentario más abajo) de que podría ser útil leer la Alegoría de la cueva de Platón para tener una idea de cómo interpretar la correlación y la causalidad como resultado de "reflexiones / proyecciones" de la realidad y cómo nosotros (o nuestras máquinas) lo percibimos. La correlación, estrictamente limitada a la Correlación de Pearson, es demasiado limitada como una interpretación del tema de la asociación de malentendidos (más amplia que la correlación) y la causalidad.