Leí el Cisne negro hace un par de años. La idea del Cisne Negro es buena y el ataque a la falacia lúdica (ver las cosas como si fueran juegos de dados, con probabilidades conocidas) es bueno, pero las estadísticas están escandalosamente tergiversadas, con el problema central de ser la afirmación incorrecta de que todas las estadísticas se desmoronan si las variables No se distribuyen normalmente. Este aspecto me molestó lo suficiente como para escribirle a Taleb la siguiente carta:
Estimado Dr. Taleb
Hace poco leí "El cisne negro". Como tú, soy fanático de Karl Popper, y me encontré de acuerdo con mucho de lo que contiene. Creo que su exposición de la falacia lúdica es básicamente sólida y llama la atención sobre un problema real y común. Sin embargo, creo que gran parte de la Parte III decepciona mal su argumento general, incluso hasta el punto de desacreditar el resto del libro. Es una pena, ya que creo que los argumentos con respecto a los Cisnes Negros y las "incógnitas desconocidas" se basan en sus méritos sin depender de algunos de los errores de la Parte III.
El tema principal que deseo señalar, y buscar su respuesta, especialmente si he entendido mal los problemas, es su tergiversación del campo de las estadísticas aplicadas. A mi juicio, los capítulos 14, 15 y 16 dependen en gran medida de un argumento del hombre de paja, que tergiversan las estadísticas y la econometría. El campo de la econometría que usted describe no es el que me enseñaron cuando estudié estadística aplicada, econometría y teoría del riesgo actuarial (en la Universidad Nacional de Australia, pero usando textos que parecían bastante estándar). Los problemas que usted plantea (como las limitaciones de las distribuciones gaussianas) se entienden y se enseñan verdaderamente, incluso a nivel de pregrado.
Por ejemplo, va hasta cierto punto para mostrar cómo la distribución del ingreso no sigue una distribución normal, y presenta esto como un argumento en contra de la práctica estadística en general. Ningún estadista competente afirmaría que lo hace, y las formas de abordar este problema están bien establecidas. Solo usando técnicas desde el nivel más básico de "econometría de primer año", por ejemplo, transformar la variable tomando su logaritmo haría que sus ejemplos numéricos parecieran mucho menos convincentes. Tal transformación de hecho invalidaría gran parte de lo que usted dice, porque entonces la varianza de la variable original aumenta a medida que aumenta su media.
Estoy seguro de que hay algunos economometristas incompetentes que realizan regresiones OLS, etc. con una variable de respuesta no transformada como usted dice, pero eso los hace incompetentes y utilizan técnicas que están bien establecidas para ser inapropiadas. Ciertamente, habrían fracasado incluso en cursos de pregrado, que pasan mucho tiempo buscando formas más apropiadas de modelar variables como el ingreso, reflejando la distribución real observada (no gaussiana).
La familia de modelos lineales generalizados es un conjunto de técnicas desarrolladas en parte para solucionar los problemas que usted plantea. Muchas de las familias de distribuciones exponenciales (p. Ej., Distribuciones gamma, exponencial y de Poisson) son asimétricas y tienen una varianza que aumenta a medida que aumenta el centro de la distribución, evitando el problema que señala utilizando la distribución gaussiana. Si esto todavía es demasiado limitante, es posible eliminar una "forma" preexistente por completo y simplemente especificar una relación entre la media de una distribución y su varianza (por ejemplo, permitir que la varianza aumente proporcionalmente al cuadrado de la media), utilizando el método de estimación "cuasi-verosimilitud".
Por supuesto, podría argumentar que esta forma de modelar es todavía demasiado simplista y una trampa intelectual que nos hace pensar que el futuro será como el pasado. Puede que tengas razón, y creo que la fortaleza de tu libro es hacer que personas como yo lo consideren. Pero necesita argumentos diferentes a los que usa en los capítulos 14-16. El gran peso que le da al hecho de que la variación de la distribución gaussiana es constante independientemente de su media (que causa problemas de escalabilidad), por ejemplo, no es válida. Así es su énfasis en el hecho de que las distribuciones de la vida real tienden a ser asimétricas en lugar de curvas de campana.
Básicamente, ha tomado una simplificación excesiva del enfoque más básico de las estadísticas (modelado ingenuo de variables en bruto como distribuciones gaussianas) y ha mostrado, con gran detalle, (correctamente) las deficiencias de un enfoque tan simplificado. Luego usa esto para hacer un hueco para desacreditar a todo el campo. Esto es un serio error de lógica o una técnica de propaganda. Es desafortunado porque resta valor a su argumento general, gran parte del cual (como dije) encontré válido y persuasivo.
Me interesaría escuchar lo que dices en respuesta. Dudo que sea el primero en haber planteado este problema.
Tuyo sinceramente
EDUCACIÓN FÍSICA