Preguntas etiquetadas con outliers

Un valor atípico es una observación que parece ser inusual o no está bien descrita en relación con una caracterización simple de un conjunto de datos. Una posibilidad desconcertante es que estos datos provienen de una población diferente a la que se pretende estudiar.

4
Detección de valores atípicos utilizando desviaciones estándar
Siguiendo mi pregunta aquí , me pregunto si hay opiniones fuertes a favor o en contra del uso de la desviación estándar para detectar valores atípicos (por ejemplo, cualquier punto de datos que tenga más de 2 desviaciones estándar es un valor atípico). Sé que esto depende del contexto del …
27 outliers 



3
Aplicación de wavelets a algoritmos de detección de anomalías basados ​​en series temporales.
He comenzado a trabajar a través de Tutoriales de minería de datos estadísticos de Andrew Moore (muy recomendable para cualquier otra persona que se aventura por primera vez en este campo). Comencé leyendo este PDF extremadamente interesante titulado "Introducción general de los algoritmos de detección de anomalías basados ​​en series …





1
Detección de valores atípicos en los datos de conteo
Tengo lo que ingenuamente pensé que era un problema bastante sencillo que implica la detección de valores atípicos para muchos conjuntos diferentes de datos de conteo. Específicamente, quiero determinar si uno o más valores en una serie de datos de conteo son más altos o más bajos de lo esperado …

3
¿Cómo evaluar la asimetría de un diagrama de caja?
Cómo decidir la asimetría observando un diagrama de caja construido a partir de estos datos: 340, 300, 520, 340, 320, 290, 260, 330 Un libro dice: "Si el cuartil inferior está más alejado de la mediana que el cuartil superior, entonces la distribución está sesgada negativamente". Varias otras fuentes dijeron …

2
Bootstrapping: ¿debo eliminar los valores atípicos primero?
Hemos realizado una prueba dividida de una nueva característica del producto y queremos medir si la mejora en los ingresos es significativa. Nuestras observaciones definitivamente no se distribuyen normalmente (la mayoría de nuestros usuarios no gastan, y dentro de las que sí lo hacen, está muy sesgada hacia muchos pequeños …

2
Detección de anomalías con características ficticias (y otras características discretas / categóricas)
tl; dr ¿Cuál es la forma recomendada de manejar los discretedatos cuando se realiza la detección de anomalías? ¿Cuál es la forma recomendada de manejar los categoricaldatos cuando se realiza la detección de anomalías? Esta respuesta sugiere usar datos discretos para simplemente filtrar los resultados. ¿Quizás reemplazar el valor de …

4
¿Cuál es la base para la definición de Plot de caja y bigote de un valor atípico?
La definición estándar de un valor atípico para un diagrama de Caja y Bigotes son los puntos fuera del rango , donde y es el primer cuartil y es el tercer cuartil de los datos. I Q R{Q1−1.5IQR,Q3+1.5IQR}{Q1−1.5IQR,Q3+1.5IQR}\left\{Q1-1.5IQR,Q3+1.5IQR\right\}IQR=Q3−Q1IQR=Q3−Q1IQR= Q3-Q1Q1Q1Q1Q3Q3Q3 ¿Cuál es la base de esta definición? Con una gran cantidad …



Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.