Si bien estoy de acuerdo con la respuesta de ncasas en la mayoría de los puntos (+1), ruego diferir en algunos:
- Los árboles de decisión también se pueden usar como modelos de caja negra. De hecho, diría que en la mayoría de los casos se usan como modelos de caja negra. Si tiene 10,000 características y un árbol de profundidad de 50, no puede esperar razonablemente que un humano lo entienda.
- Las redes neuronales se pueden entender. Existen muchas técnicas de análisis (vea el capítulo 2.5 de mi tesis de maestría para algunas que apuntan a mejorar el modelo). Especialmente análisis de oclusión (Figura 2.10), Visualización del filtro (Figura 2.11). También el ¿Por qué debería confiar en ti? papel ( mis notas ).
Explicando la predicción de un modelo de caja negra mediante un análisis de oclusión elegante (de "¿Por qué debería confiar en usted?"):
Me gustaría señalar The Mythos of Model Interpretability . Formula algunas ideas sobre la interpretabilidad de manera concisa.
Tu pregunta
¿Por qué los modelos de Machine Learning se llaman cajas negras?
Cómo lo usa la gente : porque no modelan el problema de una manera que permita a los humanos decir directamente lo que sucede para cualquier entrada dada.
Pensamientos personales
No creo que esta noción de "modelo de caja negra" tenga mucho sentido. Por ejemplo, piense en el pronóstico del tiempo. No se puede esperar que ningún humano diga qué clima se pronosticará si solo se le dan los datos. Sin embargo, la mayoría de la gente no diría que los modelos de clima físico son modelos de caja negra. Entonces, ¿dónde está la diferencia? ¿Es solo el hecho de que un modelo se generó utilizando datos y el otro se generó utilizando conocimientos sobre física?
Cuando las personas hablan de modelos de caja negra, generalmente lo dicen como si fuera algo malo. Pero los humanos también son modelos de caja negra. La diferencia crítica que veo aquí es que la clase de errores que cometen los humanos es más fácil de predecir para los humanos. Por lo tanto, es un problema de capacitación (ejemplos adversos en el lado NN) y un problema educativo (enseñar a los humanos cómo funcionan las NN).
Cómo debe usarse el término 'modelo de caja negra' : un enfoque que tiene más sentido para mí es llamar al problema un "problema de caja negra", similar a lo que escribe user144410 (+1). Por lo tanto, cualquier modelo que solo trate el problema como un cuadro negro, por lo tanto, algo en lo que puede ingresar y sacar resultados, es un modelo de cuadro negro. Los modelos que tienen ideas (¡no solo suponen!) Sobre el problema no son modelos de caja negra. La parte de la comprensión es complicada. Cada modelo establece restricciones sobre la posible función que puede modelar (sí, sé sobre el problema de aproximación universal. Siempre que use un NN de tamaño fijo, no se aplica). Yo diría que algo es una idea del problema si sabes algo sobre la relación de entrada y salida sin analizar el problema (sin mirar los datos).
Lo que sigue de esto:
- Las redes neuronales pueden ser no blackbox (¿whitebox?)
- La regresión logística puede ser un modelo de caja negra.
- Se trata más del problema y de sus ideas al respecto, menos del modelo.