Hay muchas alternativas, dependiendo del propósito.
Una común es la "diferencia porcentual relativa", o RPD, que se utiliza en los procedimientos de control de calidad de laboratorio. Aunque puede encontrar muchas fórmulas aparentemente diferentes, todas se reducen a comparar la diferencia de dos valores con su magnitud promedio:
d1(x,y)=x−y(|x|+|y|)/2=2x−y|x|+|y|.
Esta es una expresión con signo , positiva cuando excede y y negativa cuando y excede x . Su valor siempre se encuentra entre - 2 y 2 . Al usar valores absolutos en el denominador, maneja los números negativos de manera razonable. La mayoría de las referencias que puedo encontrar, como la Guía técnica de evaluación de calidad de datos y evaluación de usabilidad de datos del Programa DEP Site Remediation Site de New Jersey , usan el valor absoluto de d 1 porque solo están interesados en la magnitud del error relativo.xyyx−22d1
Un artículo de Wikipedia sobre cambio relativo y diferencia observa que
d∞(x,y)=|x−y|max(|x|,|y|)
se usa con frecuencia como prueba de tolerancia relativa en algoritmos numéricos de coma flotante. El mismo artículo también señala que las fórmulas como y d ∞ pueden generalizarse ad1d∞
df(x,y)=x−yf(x,y)
donde la función depende directamente de las magnitudes de x e y (generalmente suponiendo que x e y son positivas). Como ejemplos que ofrece su max, min, y la media aritmética (con y sin tomar los valores absolutos de x y y ellos mismos), pero se podría contemplar otros tipos de promedios, tales como la media geométrica √fxyxyxy, la media armónica2/(1/|x|+1/|y|)yLpsignifica((|x|p+|y|p)/2)1 / p. (d1corresponde ap=1yd∞corresponde al límite comop→|xy|−−−√2/(1/|x|+1/|y|)Lp((|x|p+|y|p)/2)1/pd1p=1d∞p→∞.) One might choose an f based on the expected statistical behavior of x and y. For instance, with approximately lognormal distributions the geometric mean would be an attractive choice for f because it is a meaningful average in that circumstance.
Most of these formulas run into difficulties when the denominator equals zero. In many applications that either is not possible or it is harmless to set the difference to zero when x=y=0.
Tenga en cuenta que todas estas definiciones comparten una propiedad de invariancia fundamental: cualquiera que sea la función de diferencia relativa , no cambia cuando los argumentos son reescalados uniformemente por λ > 0 :dλ>0
d(x,y)=d(λx,λy).
Es esta propiedad la que nos permite considerar como una diferencia relativa . Así, en particular, una función no invariante comod
d(x,y)=? |x−y|1+|y|
simply does not qualify. Whatever virtues it might have, it does not express a relative difference.
The story does not end here. We might even find it fruitful to push the implications of invariance a little further.
The set of all ordered pairs of real numbers (x,y)≠(0,0) where (x,y) is considered to be the same as (λx,λy) is the Real Projective Line RP1. In both a topological sense and an algebraic sense, RP1 is a circle. Any (x,y)≠(0,0) determines a unique line through the origin (0,0). When x≠0 its slope is y/x; otherwise we may consider its slope to be "infinite" (and either negative or positive). A neighborhood of this vertical line consists of lines with extremely large positive or extremely large negative slopes. We may parameterize all such lines in terms of their angle θ=arctan(y/x), with −π/2<θ≤π/2. Associated with every such θ is a point on the circle,
(ξ,η)=(cos(2θ),sin(2θ))=(x2−y2x2+y2,2xyx2+y2).
Any distance defined on the circle can therefore be used to define a relative difference.
As an example of where this can lead, consider the usual (Euclidean) distance on the circle, whereby the distance between two points is the size of the angle between them. The relative difference is least when x=y, corresponding to 2θ=π/2 (or 2θ=−3π/2 when x and y have opposite signs). From this point of view a natural relative difference for positive numbers x and y would be the distance to this angle:
dS(x,y)=∣∣2arctan(yx)−π/2∣∣.
To first order, this is the relative distance |x−yEl | / | yEl |--but it works even when y= 0. Moreover, it doesn't blow up, but instead (as a signed distance) is limited between - π/ 2 and π/ 2, as this graph indicates:
This hints at how flexible the choices are when selecting a way to measure relative differences.