Ignora las otras respuestas aquí. Esto en realidad no es una paradoja en absoluto. El problema actual que todos parecen ignorar es que estás confundiendo qué probabilidad estás viendo realmente. De hecho, hay dos promedios y estadísticas completamente diferentes en juego aquí que tienen sus propios usos e interpretaciones en su ejemplo propuesto (marketing).
En primer lugar, está el número promedio de productos comprados por cliente. Entonces, en promedio, un cliente compra 1.6 artículos. Por supuesto, un cliente no puede hacer más que 0.6 del producto (suponiendo que no sea algo como arroz o grano que tenga una medición continua asociada).
En segundo lugar, existe el número promedio de clientes que compran un producto en particular. Suena raro verdad? Entonces, en promedio, un producto tiene 5.33333333 ... clientes que lo compran. Sin embargo, esto es diferente. Lo que estamos describiendo aquí no es la cantidad de productos comprados (¡solo hay tres de ellos!) Sino la cantidad de personas que realmente compran dicho producto.
Piense en los dos valores de esta manera: ¿Qué representarían estos dos valores si hubiera un solo cliente o un solo producto? Después de todo, el promedio de un único punto de datos es solo ese punto de datos dado.
O mejor aún, piense en la tabla como si le estuviera dando cantidades en dólares gastadas para comprar el producto. Obviamente, la cantidad promedio gastada por un cliente individual será mucho menor que la cantidad de dinero ganada en promedio por un producto suministrado por una corporación importante (o incluso solo una pequeña empresa). Estoy seguro de que puede pensar en buenas maneras de usar ambos valores al hablar sobre el bienestar de la empresa.
Cuando vaya a explicar esto al personal de marketing, explíqueles tal como lo dije. No es una paradoja. Es solo una estadística completamente diferente. El único problema aquí fue notar que, de hecho, había dos formas diferentes de leer el cuadro (es decir, número de personas que compran por producto versus número de productos comprados por persona).
tl; dr lo primero que describió es la cantidad promedio que un cliente individual está dispuesto a gastar comprando sus productos. El segundo es la demanda promedio de un producto dado por parte del público. Estoy seguro de que ahora puede ver por qué ambos ciertamente no son lo mismo. Compararlos como tales solo le dará información basura.
EDITAR
Parece que la pregunta es realmente preguntar sobre el dinero promedio gastado por los clientes que compran algún producto a, b o c. Bien. En realidad, esto es solo un error en los cálculos. No llamaría a esto una paradoja. Realmente es solo un sutil flub.
Mira tus columnas. Hay personas que se comparten entre columnas. Supongamos que hiciste un promedio ponderado adecuado . Todavía estás sumando personas dos veces. Esto significa que el promedio contendrá personas adicionales con un valor mayor o igual a 2. ¿Cuál fue su promedio? ¡Era 1.6! En esencia, su promedio se ve así:
∑ni=0valueOfPersoni∗valueOfPersonin
Definitivamente esa no es la fórmula correcta. Es un promedio ponderado, aunque suponiendo exclusividad mutua, así es como se ajustaría para obtener un promedio verdadero en su situación.
∑ni=0numberOfPeopleBuyingi∗averageSpentByPersonBuyingin
De cualquier manera, obtendrá un promedio desordenado. Un error fue ignorar la necesidad de un promedio ponderado ya que una categoría tiene un "peso" mayor en términos del promedio. Es como la densidad. Un valor más denso en las personas representa. El otro problema es la adición de duplicados que distorsionará el promedio. Sin embargo, no llamo a ninguna de estas "paradojas". Una vez que vi lo que estabas haciendo, me pareció obvio por qué eso no funcionaría. El promedio ponderado se explica de alguna manera por su necesidad y creo que ahora que ves que agregaste valores varias veces ... eso no puede funcionar. Básicamente tomaste el promedio de los cuadrados de sus valores.