Una medida axiomática de la dispersión es el llamado conteo , que cuenta el número (finito) de entradas distintas de cero en un vector. Con esta medida, los vectores y poseen la misma escasez. Y absolutamente no es la misma norma . Y (muy escaso) tiene la misma norma que , un vector muy plano y no disperso. Y absolutamente no es el mismo recuento.ℓ0(1,0,0,0)(0,21,0,0)ℓ2(1,0,0,0)ℓ2(14,14,14,14)ℓ0
Esta función, ni una norma ni una cuasinorma, no es suave ni convexa. Dependiendo del dominio, sus nombres son legión, por ejemplo: función de cardinalidad, medida de numerosidad, o simplemente parsimonia o escasez. A menudo se considera poco práctico para fines prácticos, ya que su uso conduce a problemas NP difíciles .
Si bien las distancias o normas estándar (como la distancia euclidiana ) son más manejables, uno de sus problemas es su homogeneidad:para . Esto podría verse como no intuitivo, ya que el producto escalar no cambia la proporción de entradas nulas en los datos ( es -homogéneo).ℓ21
∥a.x∥=|a|∥x∥
a≠0ℓ00
Entonces, en la práctica, algunos combinaciones de ( ), como las regularizaciones de lazo, cresta o red elástica. La norma (distancia de Manhattan o taxi), o sus avatares suavizados, es especialmente útil. Como los trabajos de E. Candès y otros, uno puede explicar por qué es una buena aproximación a : una explicación geométrica . Otros han hecho en , al precio de los problemas de no convexidad.ℓp(x)p≥1ℓ1ℓ1ℓ0p<1ℓp(x)
Otro camino interesante es volver a axiomizar la noción de escasez. Uno de los trabajos notables recientes es Comparing Measures of Sparsity , de N. Hurley et al., Que trata sobre la escasez de distribuciones. A partir de seis axiomas (con nombres divertidos como Robin Hood, Scaling, Rising Tide, Cloning, Bill Gates y Babies), surgieron un par de índices de dispersión: uno basado en el índice de Gini, otro en proporciones de normas, especialmente el uno sobre dos relación norma, que se muestra a continuación:ℓ1ℓ2
Aunque no es convexa, algunas pruebas de convergencia y algunas referencias históricas se detallan en Euclides en un Taxi: Escaso deconvolución ciega con suavizado Regularizaciónℓ1ℓ2 .