Cómo interpretar la altura de la gráfica de densidad


12

¿Cómo debo interpretar las gráficas de altura de densidad?

ingrese la descripción de la imagen aquí

Por ejemplo, en la gráfica anterior, el pico es de aproximadamente 0.07 en x = 18. ¿Puedo inferir que alrededor del 7% de los valores son alrededor de 18? ¿Puedo ser más específico que eso? También hay un segundo pico en x = 30 con una altura de 0.02. ¿Eso significaría que alrededor del 2% de los valores son alrededor de 30?

Editar: La pregunta sobre ¿Puede un valor de distribución de probabilidad superior a 1 estar bien?analiza el valor de probabilidad de> 1, que no es un problema aquí en absoluto. También discute eso en relación con el ingenuo clasificador de Bayes, que tampoco es el punto aquí. Quiero tener, en un lenguaje simple, las inferencias numéricas que podemos extraer de tales curvas de densidad. Se discute el papel del área bajo la curva, pero mi pregunta es específicamente qué inferencia podemos hacer con respecto a una combinación particular de x e y que existe en la curva. Por ejemplo, ¿cómo podemos relacionar x = 30 e y = 0.02 en este gráfico? ¿Qué afirmación podemos escribir con respecto a la relación entre 30 y 0.02 aquí? Dado que las densidades son para un valor unitario, ¿podemos decir que el 2% de los valores ocurren entre 29.5 y 30.5? Si ese es el caso, ¿cómo interpretamos si los valores varían de solo 0 a 1, como en la siguiente gráfica:

ingrese la descripción de la imagen aquí

Si el 100% de los valores ocurren entre 0 y 1, ¿por qué hay una curva fuera de 0 y 1?

Aquí hay una parte plana en x = 0.1 a x = 0.2 donde y es igual a 0.8. Forma un rectángulo. ¿Cómo podemos averiguar qué proporción de valores ocurren entre x = 0.1 yx = 0.2

(PD: Si encuentra esta pregunta interesante / importante, por favor, vote a favor;)



44
El primer hilo mencionado como duplicado es relevante, a pesar de la redacción precisa en su título, ya que señala que, según se calcula para las variables continuas, una densidad de probabilidad no es una probabilidad. (Una versión más sutil definiría la densidad rigurosamente e incluiría la posibilidad de que la densidad se defina contando la medida.)
Nick Cox

Estoy de acuerdo con @NickCox, aunque con las ediciones adicionales, hay más enfoque en el área (que es como la tercera pregunta) así como en la altura (que es más como la segunda pregunta) en la muy buena lista de preguntas estrechamente relacionadas de Tim.
Silverfish

3
También hay un tema separado que no se plantea en esas preguntas, por lo que no creo que esto sea en general un duplicado de ninguna de esas preguntas individualmente: por qué en las gráficas de densidad empírica en oposición a las teóricas, ¿puede haber "densidad" fuera ¿El soporte (o valores observados) de la distribución? Eso requiere una discusión adicional sobre el ancho de banda y la construcción e interpretación de los gráficos de densidad del núcleo. Quizás esta pregunta se beneficiaría de una edición y un reenfoque en aquellos temas que no duplican las preguntas existentes.
Silverfish

Respuestas:


6

Debe tener cuidado con su redacción aquí. Suponiendo que x es una variable continua, la probabilidad de cualquier valor individual es precisamente cero. Hablar, como lo hizo, sobre la probabilidad de que un valor se encuentre en algún punto está bien, aunque es posible que desee ser un poco más preciso. Su segunda declaración, en la que proporcionó el intervalo junto con la probabilidad, es algo que estaría buscando.

En esencia, una función integral de densidad con respecto a x le informará sobre la probabilidad en sí misma (por eso se llama densidad ). Obviamente, el intervalo durante el cual se integrará puede ser arbitrariamente pequeño, por lo que puede acercarse a un punto en un grado arbitrario. Dicho esto, cuando la función de densidad varía muy lentamente durante ese intervalo, puede aproximar la integral mediante alguna técnica numérica, como la regla trapezoidal .

Para resumir: la altura de la función de densidad es solo eso, su altura. Cualquier cosa que desee concluir sobre la probabilidad tendrá que incluir la integración de una forma u otra.


¿El área bajo la curva siempre suma 1.0 en este tipo de gráfico?
ecologist1234

1
@ ecologist1234 Sí, dado que esta es una distribución de densidad de probabilidad , la integral de a (en el "peor") dará como resultado 1.0. Significa que todos los datos están en algún lugar a lo largo de ese intervalo con una probabilidad del 100%.
Fato39
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.