Tengo un montón (alrededor de 1000) de estimaciones y se supone que todas son estimaciones de elasticidad a largo plazo. Un poco más de la mitad de estos se estima utilizando el método A y el resto utilizando un método B. En algún lugar leí algo como "Creo que el método B estima algo muy diferente al método A, porque las estimaciones son mucho (50-60%) más altas ". Mi conocimiento de estadísticas robustas es casi nulo, así que solo calculé las medias y medianas de ambas muestras ... e inmediatamente vi la diferencia. El método A está muy concentrado, la diferencia entre la mediana y la media es muy pequeña, pero la muestra del método B varía enormemente.
Llegué a la conclusión de que los valores atípicos y los errores de medición sesgan la muestra del método B, por lo que descarté unos 50 valores (alrededor del 15%) que eran muy inconsistentes con la teoría ... y de repente las medias de ambas muestras (incluido su IC) fueron muy similares . Las tramas de densidad también.
(En la búsqueda de eliminar los valores atípicos, miré el rango de la muestra A y eliminé todos los puntos de muestra en B que quedaban fuera de ella). Me gustaría que me dijeras dónde puedo encontrar algunos conceptos básicos de estimación robusta de los medios que podrían permítanme juzgar esta situación más rigurosamente. Y para tener algunas referencias. No necesito una comprensión muy profunda de varias técnicas, sino leer una encuesta exhaustiva de la metodología de estimación sólida.
T probé la significación de la diferencia de medias después de eliminar los valores atípicos y el valor p es 0.0559 (t alrededor de 1.9), para las muestras completas la estadística t fue alrededor de 4.5. Pero ese no es realmente el punto, los medios pueden ser un poco diferentes, pero no deberían diferir en un 50-60% como se indicó anteriormente. Y no creo que lo hagan.