Nuevas adhockeries
En los últimos años, el hábito ortodoxo de inventar dispositivos intuitivos en lugar de apelar a los principios teóricos conectados se ha extendido a nuevos problemas de una manera que hace parecer al principio que se han creado varios nuevos campos de la ciencia. Sin embargo, a todos les preocupa el razonamiento a partir de información incompleta; y creemos que tenemos teoremas que establecen que la teoría de la probabilidad como lógica es el medio general para tratar todos esos problemas. Observamos tres ejemplos.
Los conjuntos difusos son, obviamente, para cualquier persona entrenada en inferencia bayesiana, aproximaciones crudas a las probabilidades previas bayesianas. Fueron creados solo porque sus practicantes persistieron en pensar en la probabilidad en términos de una "aleatoriedad" supuestamente existente en la Naturaleza pero nunca bien definida; y así concluyó que la teoría de probabilidad no es aplicable a tales problemas. Tan pronto como uno reconoce la probabilidad como la forma general de especificar información incompleta , desaparece la razón para introducir Conjuntos difusos.
Del mismo modo, gran parte de la Inteligencia Artificial (IA) es una colección de dispositivos intuitivos para razonar a partir de información incompleta que, como los más antiguos de las estadísticas ortodoxas, son aproximaciones a los métodos bayesianos y pueden utilizarse en una clase restringida de problemas; pero que arrojan conclusiones absurdas cuando intentamos aplicarlas a problemas fuera de esa clase. Nuevamente, sus practicantes están atrapados en esto solo porque continúan pensando que la probabilidad representa una "aleatoriedad" física en lugar de información incompleta. En la inferencia bayesiana, todos esos resultados están contenidos automáticamente, y bastante trivialmente, sin ninguna limitación a una clase restringida de problemas.
El gran desarrollo nuevo es Neural Nets, lo que significa un sistema de algoritmos con la maravillosa propiedad nueva de que son, como el cerebro humano, adaptativos para que puedan aprender de los errores del pasado y corregirse automáticamente (¡GUAU! ¡Qué gran idea!) . De hecho, no nos sorprende ver que las redes neuronales son realmente muy útiles en muchas aplicaciones; más que Fuzzy Sets o AI. Sin embargo, las redes neuronales actuales tienen dos defectos prácticos; (a) Producen una salida determinada por la entrada actual más la información de capacitación pasada. Esta salida es realmente una estimaciónde la respuesta adecuada, basada en toda la información disponible, pero no da indicios de su precisión, por lo que no nos dice qué tan cerca estamos de la meta (es decir, cuánto más entrenamiento se necesita); (b) Cuando se requiere una respuesta no lineal, se recurre a una función no lineal "sigmoide" estándar almacenada internamente, que con varias amplificaciones y mezclas lineales se puede hacer para aproximar, hasta cierto punto, la verdadera función no lineal. (Nota: énfasis mío).
Pero, ¿realmente necesitamos señalar que (1) Cualquier procedimiento que sea adaptativo es, por definición, un medio de tener en cuenta información incompleta; (2) El teorema de Bayes es precisamente la madre de todos los procedimientos adaptativos; la regla general para actualizar cualquier estado de conocimiento para tener en cuenta la nueva información; (3) Cuando estos problemas se formulan en términos bayesianos, un solo cálculo produce automáticamente la mejor estimación y su precisión; (4) Si se requiere la no linealidad, el teorema de Bayes genera automáticamente la función no lineal exacta solicitada por el problema, en lugar de intentar construir una aproximación a ella mediante otro dispositivo ad hoc .
En otras palabras, sostenemos que estos no son campos nuevos en absoluto; solo falsos comienzos. Si uno formula todos estos problemas con la receta Bayesiana estándar, automáticamente tiene todos sus resultados útiles en forma mejorada. Las dificultades que las personas parecen tener para comprender esto son ejemplos del mismo fracaso para conceptualizar la relación entre las matemáticas abstractas y el mundo real. Tan pronto como reconocemos que las probabilidades no describen la realidad, solo nuestra información sobre la realidad, las puertas están completamente abiertas a la solución óptima de los problemas de razonamiento a partir de esa información.