¿Cómo explicamos la diferencia entre la regresión logística y la red neuronal a una audiencia que no tiene antecedentes en estadísticas?
¿Cómo explicamos la diferencia entre la regresión logística y la red neuronal a una audiencia que no tiene antecedentes en estadísticas?
Respuestas:
Supongo que está pensando en lo que solía ser, y tal vez todavía se los conoce como 'perceptrones multicapa' en su pregunta sobre redes neuronales. Si es así, explicaría todo en términos de flexibilidad sobre la forma del límite de decisión en función de las variables explicativas. En particular, para esta audiencia, no mencionaría funciones de enlace / probabilidades de registro, etc. Simplemente manténgase con la idea de que la probabilidad de un evento se predice sobre la base de algunas observaciones.
Aquí hay una posible secuencia:
Las ventajas de este enfoque es que no tiene que entrar realmente en ningún detalle matemático para dar la idea correcta. De hecho, no tienen que entender ya sea la regresión logística o las redes neuronales para comprender las similitudes y diferencias.
La desventaja del enfoque es que tienes que hacer muchas fotos y resistir fuertemente la tentación de caer en el álgebra para explicar las cosas.
Para un resumen más simple:
Regresión logística: la forma más simple de red neuronal, que da como resultado límites de decisión que son una línea recta
Redes neuronales: un superconjunto que incluye regresión logística y también otros clasificadores que pueden generar límites de decisión más complejos.
(nota: me refiero a la regresión logística "simple", sin la ayuda de núcleos integrales)
(referencia: cursos de deeplearning.ai de Andrew Ng, "Regresión logística como red neuronal" y "Clasificación de datos planar con una capa oculta")
Voy a tomar la pregunta literalmente: alguien sin experiencia en estadísticas. Y no voy a tratar de darle a esa persona antecedentes en estadísticas. Por ejemplo, suponga que tiene que explicar la diferencia al CEO de una empresa o algo así.
Entonces: la regresión logística es una herramienta para modelar una variable categórica en términos de otras variables. Le brinda formas de descubrir cómo los cambios en cada una de las "otras" variables afectan las probabilidades de diferentes resultados en la primera variable. La salida es bastante fácil de interpretar.
Las redes neuronales son un conjunto de métodos para permitir que una computadora intente aprender de ejemplos de maneras que se asemejan vagamente a cómo los humanos aprenden sobre las cosas. Puede dar lugar a modelos que son buenos predictores, pero generalmente son mucho más opacos que los de la regresión logística.
Me enseñaron que se puede pensar en las redes neuronales (con funciones de activación logística) como un promedio ponderado de las funciones logit, con los propios pesos estimados. Al elegir una gran cantidad de logits, puede adaptarse a cualquier forma funcional. Hay cierta intuición gráfica en la publicación del blog Econometric Sense .
Las otras respuestas son geniales. Simplemente agregaría algunas imágenes que muestran que puede pensar en la regresión logística y la regresión logística de varias clases (también conocida como maxent, regresión logística multinomial, regresión softmax, clasificador de entropía máxima) como una arquitectura especial de redes neuronales.
De Sebastian Raschka, Michigan State University, en KDnuggets :
Algunas ilustraciones más para la regresión logística de varias clases:
Una ilustración similar tomada de http://www.deeplearningbook.org/ capítulo 1:
Y uno más de los tutoriales de TensorFlow :
Por ejemplo, en Caffe , implementaría la regresión logística de la siguiente manera :
Usaría un ejemplo de un problema complicado pero concreto que la audiencia comprende. Utilice nodos ocultos cuyas interpretaciones no estén entrenadas, pero tengan significados particulares.
La regresión lineal determina cuán bueno es tener un caballero blanco en h4. Puede que no sea obvio que es bueno en absoluto, pero si está en h4 no se ha capturado, lo que probablemente supera otras consideraciones. La regresión lineal probablemente recupera los valores aproximados de las piezas, y que es mejor tener sus piezas hacia el centro del tablero y en el lado del tablero de su oponente. La regresión lineal no puede valorar combinaciones, como que tu reina en b2 de repente sea más valiosa si el rey contrario está en a1.
Una red neuronal podría tener nodos ocultos para conceptos, tales como "ventaja material", "seguridad del rey negro", "control del centro", "ambas torres en el archivo d", "peón de torres reina aislado" u "obispo movilidad." Algunos de estos pueden estimarse solo a partir de las entradas de la placa, mientras que otros pueden tener que estar en una segunda capa oculta o posterior. La red neuronal puede usarlos como entradas para la evaluación final de la posición. Estos conceptos ayudan a un experto a evaluar una posición, por lo que una red neuronal debería ser capaz de realizar evaluaciones más precisas que una regresión lineal. Sin embargo, se necesita más trabajo para crear la red neuronal, ya que debe elegir su estructura y tiene muchos más parámetros para entrenar.