Aprecio las otras respuestas, pero me parece que algunos antecedentes topológicos darían una estructura muy necesaria a las respuestas.
Definiciones
Comencemos por establecer las definiciones de los dominios:
La variable categórica es aquella cuyo dominio contiene elementos, pero no existe una relación conocida entre ellos (por lo tanto, solo tenemos categorías). Los ejemplos dependen del contexto, pero yo diría que en el caso general, es difícil comparar los días de la semana: es lunes antes del domingo, si es así, ¿qué pasa con el próximo lunes? Quizás un ejemplo más fácil, pero menos usado, son las prendas de vestir: sin proporcionar un contexto que tenga sentido para una orden, es difícil decir si los pantalones van antes que los puentes o viceversa.
La variable ordinal es aquella que tiene un orden total definido sobre el dominio, es decir, por cada dos elementos del dominio, podemos decir que son idénticos o uno es más grande que el otro. Una escala Likert es un buen ejemplo de una definición de una variable ordinal. "algo de acuerdo" está definitivamente más cerca de "totalmente de acuerdo" que "en desacuerdo".
La variable de intervalo es una, cuyo dominio define distancias entre elementos (una métrica ), lo que nos permite definir intervalos.
Ejemplos de dominio
Como el conjunto más común que utilizamos, los números naturales y reales tienen un orden total estándar y métricas. Es por eso que debemos tener cuidado cuando asignamos números a nuestras categorías. Si no tenemos cuidado de ignorar el orden y la distancia, prácticamente convertimos nuestros datos categóricos en datos de intervalo. Cuando uno usa un algoritmo de aprendizaje automático sin saber cómo funciona, se corre el riesgo de hacer tales suposiciones de mala gana, lo que potencialmente invalida los propios resultados. Por ejemplo, los algoritmos de aprendizaje profundo más populares funcionan con números reales aprovechando sus propiedades de intervalo y continuas. Otro ejemplo, piense en escalas de Likert de 5 puntos, y cómo el análisis que aplicamos en ellas supone que la distancia entre totalmente de acuerdo y de acuerdoes lo mismo que estar en desacuerdo y ni de acuerdo ni en desacuerdo . Difícil hacer un caso para tal relación.
Otro conjunto con el que a menudo trabajamos son las cadenas . Hay varias métricas de similitud de cadenas que son útiles cuando se trabaja con cadenas. Sin embargo, estos no siempre son útiles. Por ejemplo, para las direcciones, John Smith Street y John Smith Road están bastante cerca en términos de similitud de cadenas, pero obviamente representan dos entidades diferentes que podrían estar a millas de distancia.
Resumen estadístico
Ok, ahora veamos cómo encajan algunas estadísticas resumidas en esto. Como las estadísticas funcionan con números, sus funciones están bien definidas en intervalos. Pero veamos ejemplos sobre si / cómo podríamos generalizarlos a datos categóricos u ordinales:
- modo : tanto al trabajar con datos categóricos como ordinales, podemos saber qué elemento se usa con más frecuencia. Entonces tenemos esto. Entonces también podemos derivar todas las otras medidas que @Maddenker enumera en su respuesta. El intervalo de confianza de @gung también podría ser útil.
- mediana - como dice @ peter-flom, siempre que tenga un pedido, puede derivar su mediana.
- media , pero también desviación estándar, percentiles, etc., los obtiene solo con datos de intervalo, debido a la necesidad de una métrica de distancia.
Ejemplo de contextualidad de datos.
Al final, quiero enfatizar nuevamente que el orden y las métricas que define en sus datos son muy contextuales. Esto ya debería ser obvio, pero déjame darte un último ejemplo: cuando trabajamos con ubicaciones geográficas, tenemos muchas formas diferentes de abordarlas:
- Si estamos interesados en la distancia entre ellos, podemos trabajar con su geolocalización, que básicamente nos da un espacio numérico bidimensional, por lo tanto, intervalo.
- Si estamos interesados en su parte de la relación, podemos definir un orden total (por ejemplo, una calle es parte de una ciudad, dos ciudades son iguales, un continente contiene un país)
- Si estamos interesados en saber si dos cadenas representan la misma dirección, podríamos trabajar con cierta distancia de cadena que toleraría errores de ortografía e intercambio de posiciones de palabras, pero asegúrese de distinguir diferentes términos y nombres. Esto no es una cosa fácil, sino solo para hacer el caso.
- Hay muchos otros casos de uso, que todos nosotros encontramos a diario, donde nada de esto tiene sentido. En algunos de ellos no hay nada más que hacer que tratar las direcciones como categorías diferentes, en otros se trata de modelado y preprocesamiento de datos muy inteligentes.