Preguntas etiquetadas con outliers

Un valor atípico es una observación que parece ser inusual o no está bien descrita en relación con una caracterización simple de un conjunto de datos. Una posibilidad desconcertante es que estos datos provienen de una población diferente a la que se pretende estudiar.




3
Detección de valores atípicos robustos en series financieras
Estoy buscando algunas técnicas robustas para eliminar los valores atípicos y los errores (cualquiera sea la causa) de los datos financieros de series temporales (es decir, tickdata). Los datos de series de tiempo financieras tick-by-tick son muy desordenados. Contiene grandes brechas (de tiempo) cuando el intercambio está cerrado, y hace …

5
¿Es una trampa descartar los valores atípicos basados ​​en el diagrama de caja de Error absoluto medio para mejorar un modelo de regresión?
Tengo un modelo de predicción probado con cuatro métodos, como puede ver en la figura del diagrama de caja a continuación. El atributo que predice el modelo está en el rango de 0-8. Puede notar que hay un valor atípico de límite superior y tres valores atípicos de límite inferior …

2
¿Significado preciso y comparación entre un punto influyente, un alto punto de apalancamiento y un valor atípico?
De Wikipedia Las observaciones influyentes son aquellas que tienen un efecto relativamente grande en las predicciones del modelo de regresión. De Wikipedia Los puntos de apalancamiento son aquellas observaciones, si las hay, hechas a valores extremos o periféricos de las variables independientes, de modo que la falta de observaciones vecinas …


3
Curso intensivo en estimación media robusta
Tengo un montón (alrededor de 1000) de estimaciones y se supone que todas son estimaciones de elasticidad a largo plazo. Un poco más de la mitad de estos se estima utilizando el método A y el resto utilizando un método B. En algún lugar leí algo como "Creo que el …


5
¿Hay una manera simple de detectar valores atípicos?
Me pregunto si hay una manera simple de detectar valores atípicos. Para uno de mis proyectos, que era básicamente una correlación entre la cantidad de veces que los encuestados participan en actividades físicas en una semana y la cantidad de veces que comen fuera de casa (comida rápida) en una …

1
Descartar valores atípicos basados ​​en "2.5 veces el RMSE"
En Kahneman y Deaton (2010) † , los autores escriben lo siguiente:††^\dagger Esta regresión explica el 37% de la varianza, con un error cuadrático medio (RMSE) de 0.67852. Para eliminar los valores atípicos y los informes de ingresos inverosímiles, descartamos observaciones en las que el valor absoluto de la diferencia …



1
LARS vs descenso coordinado para el lazo
¿Cuáles son los pros y los contras de usar LARS [1] versus usar el descenso coordinado para ajustar la regresión lineal regularizada por L1? Estoy principalmente interesado en los aspectos de rendimiento (mis problemas tienden a tener Ncientos de miles y p<20). Sin embargo, cualquier otra información también sería apreciada. …


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.