No estoy de acuerdo con la respuesta anterior y con su sugerencia por dos razones:
1) Los árboles de decisión se basan en decisiones lógicas simples que combinadas pueden tomar decisiones más complejas. PERO si su entrada tiene 1000 dimensiones, y las características aprendidas son altamente no lineales, obtendrá un árbol de decisión realmente grande y pesado que no podrá leer / comprender simplemente mirando los nodos.
2) Las redes neuronales son similares a las de la función que aprenden solo si son muy pequeñas. Cuando te haces grande, necesitas otros trucos para entenderlos. Como sugirió @SmallChess, puede leer este artículo llamado Visualizar y comprender las redes convolucionales que explica el caso particular de las redes neuronales convolucionales, cómo puede leer los pesos para comprender cosas como "detectó un automóvil en esta imagen, principalmente debido a ruedas, no el resto de los componentes ".
Estas visualizaciones ayudaron a muchos investigadores a comprender realmente las debilidades en sus arquitecturas neuronales y ayudaron a mejorar los algoritmos de entrenamiento.