¿Alguna idea de por qué no usamos dígitos significativos en las estadísticas? Algo en la línea de que estamos usando estimaciones para que no se apliquen las reglas sobre precisión;)?
¿Alguna idea de por qué no usamos dígitos significativos en las estadísticas? Algo en la línea de que estamos usando estimaciones para que no se apliquen las reglas sobre precisión;)?
Respuestas:
Se usan dígitos significativos en algunos campos (aprendí sobre ellos en Química) para indicar el grado de precisión significativa que existe en un número. Este es un tema importante en las estadísticas también, por lo que, de hecho, lo informamos constantemente, solo lo informamos de una forma diferente. Específicamente, informamos los intervalos de confianza , que indican el nivel de precisión de una estimación (como una media).
Una vez que haya incluido el IC del 95% para una estimación, como , puede enumerar tantos dígitos para su media como desee, como 0.50129519823975923 , y no hay problema. De hecho, el estadístico Andrew Gelman ha recomendado que enumere al menos cuatro (2009, p. 4) .
Una razón para restringir el número de dígitos reportados en muchas estimaciones, valores p, etc. se basa en la percepción. Informar algo como p = 0.04872429 implica un nivel de precisión en los resultados que hace que se perciban como más precisos .
Esencialmente, el uso de un alto número de dígitos para informar resultados estadísticos prueba demasiado el hecho de intentar ocultar sus hallazgos en un aire de autoridad inmerecido.
Creo que realmente depende del nivel de confianza requerido, menos dígitos para la significación son apropiados para el 95%, en comparación con el 99.999% o más, por ejemplo, como el utilizado por el CERN para muchos de sus resultados.
¿Estás hablando de redondear tus datos a un número de dígitos significativos o redondear tu respuesta final? Si redondea sus datos, puede entrar en situaciones en las que ha arrojado el ruido que los cálculos estadísticos deben usar.