En el muestreo por encuesta, se necesita el error estándar de la estimación de la proporción. Depende más de i que de j. También requiere que las boletas abiertas i se seleccionen al azar. Si p es la verdadera proporción final para el candidato A, entonces la varianza de la estimación es
( 1 - ij) p ( 1 - p )yo
(1 - ij)se llama factor de corrección de población finita. Para estimar esta varianza, la estimación usual para p se sustituye por p en la fórmula. El error estándar se obtiene al sacar la raíz cuadrada. Al predecir un ganador, el encuestador podría usar la estimación más o menos 3 errores estándar. Si 0.5 no está contenido en el intervalo, entonces el candidato A se declara ganador si 0.5 está por debajo del límite inferior, o su oponente se declara ganador si 0.5 está por encima del límite superior. Por supuesto, esto solo dice con mucha confianza quién será el ganador en caso de que 0.5 esté fuera del intervalo. El nivel de confianza es 0.99 si tres errores estándar es lo que usa (basado en la aproximación normal al binomio). Si 0.5 está dentro del intervalo, nadie se declara ganador y el encuestador espera a que se acumulen más datos.
Al hacer una proyección, los encuestadores pueden seleccionar una muestra aleatoria estratificada de los votos acumulados para evitar posibles sesgos que pueden ocurrir si se miran todas las papeletas contadas. El problema con mirar todos los votos acumulados es que ciertos recintos completan el recuento sobre otros y pueden no ser representativos de la población.
El artículo aquí proporciona una buena cobertura del problema y numerosas referencias.
Se ha señalado que los votos acumulados pueden proporcionar estimaciones sesgadas de las proporciones porque los precintos que aún no se han informado son recintos que tienden a favorecer al partido con el candidato que está siguiendo o las boletas en ausencia probablemente favorezcan al candidato que está siguiendo y esos votos se cuentan al final. Los encuestadores sofisticados como Harris y Gallup no caen en tales trampas. El simple análisis de la construcción de intervalos de confianza basados en los votos acumulados que he esbozado es solo un factor que se utiliza. Estos encuestadores tienen mucha más información a su disposición. Tienen encuestas que se realizaron poco antes de las elecciones y tienen los patrones de votación de todos los recintos electorales y votos ausentes tomados en las elecciones en los últimos años.
Entonces, si hay sesgos claros que podrían llevar a una elección cerrada en la dirección opuesta, los encuestadores lo reconocerán y no proyectarán un ganador.
En los Estados Unidos, las boletas en ausencia provienen principalmente de los militares en el extranjero y estudiantes universitarios que están en la escuela lejos de casa. Mientras que los militares tienden a ser más conservadores y tienen más probabilidades de votar por los republicanos, los estudiantes universitarios tienden a ser más liberales y tienen más probabilidades de votar por los demócratas. Todas estas consideraciones son tomadas en cuenta.
El cuidado y la sofisticación de las encuestas modernas es la razón por la que no se han producido errores graves como la encuesta Literary Digest de 1936 o la concesión prematura del periódico de Chicago de las elecciones de 1948 a Dewey desde entonces.