¿Existe un sesgo conocido con las encuestas telefónicas en los Estados Unidos?
Sí, existe un sesgo conocido con las encuestas telefónicas en los Estados Unidos: los teléfonos celulares.
Durante mucho tiempo, el estándar de oro de las encuestas telefónicas aleatorias en los EE. UU. Fue la marcación aleatoria de dígitos: las máquinas generaban números de teléfono aleatorios y los encuestadores hacían preguntas a quien contestaba. Suponiendo que todos tuvieran un solo teléfono, la encuesta fue una muestra aleatoria simple de propietarios de teléfonos.
Sin embargo, la llegada de los teléfonos celulares cambió eso: muchas personas, especialmente los jóvenes, no tienen teléfono fijo. Incluso dentro de datos demográficos específicos (grupo de edad, género, raza), estas poblaciones que solo usan teléfonos celulares tienen actitudes políticas distintas de las poblaciones con teléfonos fijos o ambos tipos de teléfonos. Como es ilegal que los marcadores automáticos llamen a teléfonos celulares, esto causa estragos en las encuestas.
Para los encuestadores, esto significa que tienen que usar seres humanos para llamar a todos los teléfonos celulares, lo que obviamente es mucho más costoso. Por lo tanto, los encuestadores deben, a priori , decidir cuántos teléfonos celulares deben llamar para controlar los costos. El número de llamadas de teléfonos celulares debe compararse con el número de llamadas automáticas de línea fija de una manera científicamente sólida, marcando suficientes casas solo para teléfonos celulares, casas solo para líneas fijas y casas con ambos en proporción a su incidencia en la población, todo mientras no excediendo su presupuesto!
El efecto de los teléfonos celulares probablemente no sea la fuente de sesgos potenciales.
Sospecho que los encuestadores que utilizó la encuesta del Washington Times / ABC son muy conscientes de todo esto, ya que la forma de construir una muestra aleatoria a la luz del "efecto del teléfono celular" es prácticamente el tema que todas las encuestas políticas contemporáneas están abordando hoy. Por lo tanto, es probable que los encuestadores hayan tomado medidas para mitigar el "efecto del teléfono celular" en esta encuesta. Sin embargo, quizás los encuestadores tuvieron un mal día y su marcación aleatoria de números de teléfonos celulares no arrojó suficientes respuestas reales.
Si hay sesgo, podrían ser los pesos de muestra.
Otra fuente potencial de sesgo en estas encuestas es la ponderación de la muestra. El objetivo de ponderar muestras es reducir la cantidad de personas que necesita alcanzar en varios (combinaciones de) grupos demográficos atribuyendo diferentes pesos a diferentes segmentos de población. Esto, por supuesto, lleva a la pregunta "¿cómo sabe que ha ponderado la muestra correctamente?" Esta es la razón por la cual algunas empresas encuestadoras tendrán estimaciones que están consistentemente por encima / debajo de las de otras empresas encuestadoras: tienen diferentes métodos para ponderar su muestra, y eso lleva constantemente el resultado en una dirección particular.
Este es un ejemplo de la compensación de sesgo-varianza. Los encuestadores podrían usar una muestra aleatoria pequeña y simple para lograr una estimación de alta varianza. O podrían usar pesos para reducir la varianza de la estimación de la muestra pequeña, pero a costa del sesgo (estadístico).
Los encuestadores (y los estadísticos en general) tienen que lidiar con el equilibrio de sesgo-varianza de una forma u otra. No significa necesariamente que sean malévolos o que intenten manipular al público.
Abundan las explicaciones alternativas.
Hay muchas maneras de estropear una encuesta, accidental o deliberadamente. Reformular una pregunta puede producir diferentes respuestas entre diferentes grupos. El sondeo push, en el que las preguntas se enmarcan para obtener una respuesta particular, es el ejemplo más obvio y nefasto de esto.
¿Una organización interesada en manipular la opinión pública elegiría una encuesta telefónica, encuestas en línea o entrevistas en la calle, si buscaran un sesgo específico?
Esta pregunta no es enteramente estadística, ya que exige especulación sobre los motivos y métodos de alguna entidad hipotética y malévola. Solo puedo responderlo parcialmente.
Entrevistar a personas en la calle no es realmente aleatorio, y probablemente sea parcial (en el sentido de que tenderá a incluir algunos grupos en mayor proporción que otros).
El objetivo de la marcación de dígitos aleatorios es lograr un estado en el que todos tengan la misma probabilidad de selección. Ir a una esquina y entrevistar a personas no logra esto, porque tenderás a incluir a personas que viven y trabajan cerca. Si va a una calle en Washington, DC, tendrá casi 0 posibilidades de seleccionar una persona que no sea de DC, Maryland o Virginia.
Además, considere a qué calle va. Entrevistar a personas en la calle en, digamos, el vecindario de Cleveland Park en Washington, DC será muy diferente a entrevistar a personas en la calle en Anacostia: estos lugares tienen una composición demográfica muy distinta.
Las encuestas a personas en línea no son realmente aleatorias, pero no está claro si es peor que las encuestas telefónicas.
La población de personas que optan por participar en una encuesta en línea es una población autoseleccionada, no necesariamente muestreada al azar de todos los encuestados potenciales. Los encuestadores tradicionales que tienden a favorecer las encuestas telefónicas son muy escépticos con respecto a las encuestas en línea por este motivo. Sin embargo, las personas como Andrew Gelman están menos seguras de que el resultado final de una encuesta telefónica marcada al azar y una encuesta en línea autoseleccionada es significativamente diferente. Esta es en gran medida un área abierta de investigación.