Parece que estás imaginando un modelo de muestreo muy simple.
El modelo más simple para el muestreo se llama acertadamente muestreo aleatorio simple . Usted selecciona un subconjunto de la población (por ejemplo, marcando números de teléfono al azar) y pregunta a quien responde cómo está votando. Si 487 dicen Clinton, 463 dicen Trump, y el resto le da una respuesta descabellada, entonces la empresa encuestadora informaría que el 49% de los votantes prefiere Clinton, mientras que el 46% prefiere Trump. Sin embargo, las empresas encuestadoras hacen mucho más que esto. Una muestra aleatoria simple otorga el mismo peso a cada punto de datos. Sin embargo, suponga que su muestra contiene, por casualidad, 600 hombres y 400 mujeres, lo que claramente no es representativo de la población en general. Si los hombres como grupo se inclinan hacia un lado, mientras que las mujeres se inclinan hacia el otro, esto sesgará su resultado. Sin embargo, dado que tenemos estadísticas demográficas bastante buenas, puede pesar *las respuestas contando las respuestas de las mujeres un poco más y las de los hombres un poco menos, de modo que la respuesta ponderada represente mejor a la población. Las organizaciones de encuestas tienen modelos de pesaje más complicados que pueden hacer que una muestra no representativa se parezca a una más representativa.
La idea de ponderar las respuestas de la muestra tiene una base estadística bastante firme, pero hay cierta flexibilidad en la elección de los factores que contribuyen a las ponderaciones. La mayoría de los encuestadores vuelven a pesar basándose en factores demográficos como el género, la edad y la raza. Dado esto, usted podría pensar que la identificación del partido (demócrata, republicana, etc.) también debería incluirse, pero resulta que la mayoría de las empresas encuestadoras sí no la usan en sus pesas: la (auto) identificación del partido está enredada con la elección del votante de una manera que lo hace menos útil.
Muchos equipos de votación también informan sus resultados entre los "votantes probables". En estos, los encuestados son seleccionados o ponderados en función de la probabilidad de que realmente vayan a las urnas. Sin duda, este modelo también se basa en datos, pero la elección precisa de los factores permite cierta flexibilidad. Por ejemplo, incluir interacciones entre el candidato y la raza (o género) del votante ni siquiera fue sensato hasta 2008 o 2016, pero sospecho que ahora tienen cierto poder predictivo.
En teoría, podría incluir todo tipo de cosas como factores de ponderación: preferencia musical, color de ojos, etc. Sin embargo, los factores demográficos son opciones populares para los factores de ponderación porque:
- Empíricamente, se correlacionan bien con el comportamiento de los votantes. Obviamente, no existe una ley revestida de hierro que "obligue" a los hombres blancos a ser republicanos delgados, pero en los últimos cincuenta años, han tendido a hacerlo.
- Los valores de la población son bien conocidos (por ejemplo, del censo o de los registros vitales)
Sin embargo, los encuestadores también ven las mismas noticias que todos los demás y pueden ajustar las variables de ponderación si es necesario.
También hay algunos "factores falsos" que a veces se invocan para explicar los resultados de la encuesta. Por ejemplo, los encuestados a veces son reacios a dar respuestas "socialmente indeseables". El efecto Bradley plantea que los votantes blancos a veces minimizan su apoyo a los candidatos blancos que se enfrentan a una minoría para evitar parecer racistas. Lleva el nombre de Tom Bradley, un candidato a gobernador afroamericano que perdió por poco las elecciones a pesar de liderar cómodamente en las encuestas.
Finalmente, tienes toda la razón de que el solo hecho de pedirle la opinión a alguien puede cambiarlo. Las empresas encuestadoras intentan escribir sus preguntas de manera neutral. Para evitar problemas con el orden de las posibles respuestas, los nombres de los candidatos pueden aparecer en orden aleatorio. Varias versiones de una pregunta también a veces se prueban unas contra otras. Este efecto también puede explotarse para fines nefastos en una encuesta de empuje , donde el entrevistador no está realmente interesado en recopilar respuestas sino en influir en ellas. Por ejemplo, una encuesta de inserción podría preguntar "¿Votaría por [Candidato A] incluso si se informara que fue un abusador de menores?".
* También puede establecer objetivos explícitos para su muestra, como 500 hombres y 500 mujeres. Esto se llama
muestreo estratificado: la población se estratifica en diferentes grupos, y cada grupo se muestrea al azar. En la práctica, esto no se hace con mucha frecuencia para las encuestas, porque necesitaría estratificarse en muchos grupos exhaustivos (por ejemplo, hombres con educación universitaria entre 18 y 24 años en el área urbana de Texas).