Tengo algunos datos multivariados de belleza frente a edades. Las edades van de 20 a 40 a intervalos de 2 (20, 22, 24 ... 40), y para cada registro de datos, se les asigna una edad y una calificación de belleza de 1 a 5. Cuando hago diagramas de caja de estos datos (edades en el eje X, calificaciones de belleza en el eje Y), hay algunos valores atípicos trazados fuera de los bigotes de cada caja.
Quiero eliminar estos valores atípicos del marco de datos en sí, pero no estoy seguro de cómo R calcula los valores atípicos para sus diagramas de caja. A continuación se muestra un ejemplo de cómo podrían verse mis datos.
boxplot
función devuelve los valores atípicos (entre otras estadísticas) de forma invisible. Intentefoo <- boxplot(...); foo
leer?boxplot
para comprender el resultado.