Estoy interesado en la definición de cuartil que generalmente se usa cuando estás en estadísticas básicas. Tengo un libro de tipo Stat 101 y solo da una definición intuitiva. "Aproximadamente una cuarta parte de los datos cae en o debajo del primer cuartil ..." Pero, da un ejemplo donde calcula Q1, Q2 y Q3 para el conjunto de datos
5, 7, 9, 10, 11, 13, 14, 15, 16, 17, 18, 18, 20, 21, 37
Como hay 15 piezas de datos, elige 15 como la mediana, Q2. Luego divide los datos restantes en dos mitades, 5 a 14 y 16 a 37. Cada uno contiene 7 datos y encuentran la mediana de cada uno de estos conjuntos, 10 y 18, como Q1 y Q3, respectivamente. Así es como lo calcularía yo mismo.
Miré el artículo de Wikipedia y da 2 métodos. Uno está de acuerdo con lo anterior, y uno dice que también podría incluir la mediana 15 en ambos conjuntos (pero no incluiría la mediana si fuera el promedio de los dos números intermedios en el caso de un número par de puntos de datos). Todo esto tiene sentido para mí.
Pero, luego verifiqué Excel para ver cómo Excel lo calcula. Estoy usando Excel 2010, que tiene 3 funciones diferentes. Cuartil estaba disponible en 2007 y versiones anteriores. Parece que quieren que dejes de usar esto en 2010, pero todavía está disponible. Quartile.Inc es nuevo pero, por lo que puedo decir, coincide exactamente con Quartile. Y también está Quartile.Exc. Los dos últimos son nuevos en 2010, creo. Esta vez, intenté usar los enteros 1, 2, 3, ..., 10. Espero que Excel dé una mediana de 5.5, Q1 de 3 y Q3 de 8. El método del libro de estadísticas también ya que ambos métodos en Wikipedia darían estas respuestas, ya que la mediana es el promedio de los dos números del medio. Excel da
quartile number, Quartile.Inc, Quartile.Exc
1, 3.25, 2.75
2, 5.5, 5.5
3, 7.75, 8.25
Ninguno de estos está de acuerdo con lo que he hablado anteriormente.
Las descripciones en el archivo de ayuda para Excel son:
Quartile.Inc: devuelve el cuartil de un conjunto de datos, basado en valores de percentil de 0..1, inclusive.
Quartile.Exc: devuelve el cuartil del conjunto de datos, basado en valores de percentil de 0..1, exclusivo.
¿Alguien puede ayudarme a entender esta definición que Excel está usando?