¿Cuál es la diferencia entre aprendizaje supervisado y aprendizaje no supervisado? [cerrado]


283

En términos de inteligencia artificial y aprendizaje automático, ¿cuál es la diferencia entre el aprendizaje supervisado y el no supervisado? ¿Puede proporcionar una explicación básica y fácil con un ejemplo?

Respuestas:


501

Dado que hace esta pregunta muy básica, parece que vale la pena especificar qué es el aprendizaje automático.

El aprendizaje automático es una clase de algoritmos que se basa en datos, es decir, a diferencia de los algoritmos "normales", son los datos los que "dicen" cuál es la "buena respuesta". Ejemplo: un algoritmo hipotético de aprendizaje no automático para la detección de rostros en imágenes trataría de definir qué es un rostro (disco redondo de color de piel, con área oscura donde se esperan los ojos, etc.). Un algoritmo de aprendizaje automático no tendría esa definición codificada, pero "aprendería con ejemplos": mostrará varias imágenes de caras y no caras y un buen algoritmo eventualmente aprenderá y podrá predecir si un invisible La imagen es una cara.

Este ejemplo particular de detección de rostros es supervisado , lo que significa que sus ejemplos deben estar etiquetados o decir explícitamente cuáles son caras y cuáles no.

En un algoritmo no supervisado , sus ejemplos no están etiquetados , es decir, no dice nada. Por supuesto, en tal caso, el algoritmo en sí mismo no puede "inventar" qué es una cara, pero puede intentar agrupar los datos en diferentes grupos, por ejemplo, puede distinguir que las caras son muy diferentes de los paisajes, que son muy diferentes de los caballos.

Como otra respuesta lo menciona (aunque de manera incorrecta): hay formas "intermedias" de supervisión, es decir, aprendizaje semi-supervisado y activo . Técnicamente, estos son métodos supervisados ​​en los que existe una forma "inteligente" de evitar una gran cantidad de ejemplos etiquetados. En el aprendizaje activo, el algoritmo mismo decide qué cosa debe etiquetar (por ejemplo, puede estar bastante seguro sobre un paisaje y un caballo, pero podría pedirle que confirme si un gorila es realmente la imagen de una cara). En el aprendizaje semi-supervisado, hay dos algoritmos diferentes que comienzan con los ejemplos etiquetados y luego "se cuentan" entre sí la forma en que piensan acerca de una gran cantidad de datos sin etiquetar. De esta "discusión" aprenden.


@ChuckTesta No, esto es totalmente diferente. También podemos encontrar algunas investigaciones sobre el aprendizaje activo en línea.
shn

@ChuckTesta Active Learning es un subconjunto del aprendizaje en línea. En el caso del aprendizaje en línea, el algoritmo recibe datos en un orden secuencial (flujo) en lugar del aprendizaje por lotes, donde el algoritmo aprende en todo el conjunto de datos en su conjunto. Además, en el aprendizaje activo, el algoritmo decide de qué punto de datos entrantes aprender (consulte su etiqueta desde el oráculo). En caso de restricciones de costos de aprendizaje (presencia de un presupuesto de consulta), el aprendizaje activo generalmente supera a varios algoritmos de aprendizaje en línea.
Codicioso codificador

55

Aprendizaje supervisado es cuando los datos con los que alimenta su algoritmo están "etiquetados" o "etiquetados", para ayudar a su lógica a tomar decisiones.

Ejemplo: filtrado de spam de Bayes, donde debe marcar un elemento como spam para refinar los resultados.

El aprendizaje no supervisado son tipos de algoritmos que intentan encontrar correlaciones sin entradas externas que no sean los datos sin procesar.

Ejemplo: algoritmos de agrupación de minería de datos.


33

Aprendizaje supervisado

Las aplicaciones en las que los datos de entrenamiento comprenden ejemplos de los vectores de entrada junto con sus vectores objetivo correspondientes se conocen como problemas de aprendizaje supervisados.

Aprendizaje sin supervisión

En otros problemas de reconocimiento de patrones, los datos de entrenamiento consisten en un conjunto de vectores de entrada x sin ningún valor objetivo correspondiente. El objetivo en tales problemas de aprendizaje no supervisados ​​puede ser descubrir grupos de ejemplos similares dentro de los datos, donde se denomina agrupamiento

Reconocimiento de patrones y aprendizaje automático (Bishop, 2006)


2
¿Podría ilustrar entre vectores de entrada y vectores de destino?
ladrón

20

En el aprendizaje supervisado, la entrada xse proporciona con el resultado esperado y(es decir, la salida que se supone que produce el modelo cuando la entrada es x), que a menudo se llama la "clase" (o "etiqueta") de la entrada correspondientex .

En el aprendizaje no supervisado, xno se proporciona la "clase" de un ejemplo . Por lo tanto, se puede pensar que el aprendizaje no supervisado encuentra "estructura oculta" en un conjunto de datos no etiquetados.

Los enfoques para el aprendizaje supervisado incluyen:

  • Clasificación (1R, Naive Bayes, algoritmo de aprendizaje del árbol de decisión, como ID3 CART, etc.)

  • Predicción de valor numérico

Los enfoques para el aprendizaje no supervisado incluyen:

  • Agrupación (K-means, agrupación jerárquica)

  • Aprendizaje de reglas de asociación


13

Por ejemplo, muy a menudo entrenar una red neuronal es aprendizaje supervisado: le estás diciendo a la red a qué clase corresponde el vector de características que estás alimentando.

La agrupación es un aprendizaje no supervisado: permite que el algoritmo decida cómo agrupar muestras en clases que comparten propiedades comunes.

Otro ejemplo de aprendizaje no supervisado son los mapas autoorganizados de Kohonen .


12

Te puedo decir un ejemplo.

Suponga que necesita reconocer qué vehículo es un automóvil y cuál es una motocicleta.

En el supervisado caso de aprendizaje , su conjunto de datos de entrada (entrenamiento) debe estar etiquetado, es decir, para cada elemento de entrada en su conjunto de datos de entrada (entrenamiento), debe especificar si representa un automóvil o una motocicleta.

En el caso de aprendizaje no supervisado , no se etiquetan las entradas. El modelo no supervisado agrupa la entrada en grupos basados, por ejemplo, en características / propiedades similares. Entonces, en este caso, no hay etiquetas como "auto".


6

Aprendizaje supervisado

El aprendizaje supervisado se basa en entrenar una muestra de datos de la fuente de datos con la clasificación correcta ya asignada. Dichas técnicas se utilizan en modelos de Perfortrón multicapa o multicapa (MLP). Estos MLP tienen tres características distintivas:

  1. Una o más capas de neuronas ocultas que no forman parte de las capas de entrada o salida de la red que permiten a la red aprender y resolver problemas complejos
  2. La no linealidad reflejada en la actividad neuronal es diferenciable y,
  3. El modelo de interconexión de la red exhibe un alto grado de conectividad.

Estas características junto con el aprendizaje a través del entrenamiento resuelven problemas difíciles y diversos. El aprendizaje mediante la capacitación en un modelo ANN supervisado también se denomina algoritmo de retropropagación de error. El algoritmo de aprendizaje de corrección de errores entrena la red en función de las muestras de entrada-salida y encuentra la señal de error, que es la diferencia de la salida calculada y la salida deseada y ajusta los pesos sinápticos de las neuronas que es proporcional al producto del error señal y la instancia de entrada del peso sináptico. En base a este principio, el aprendizaje de propagación por error se produce en dos pasos:

Pase adelantado:

Aquí, el vector de entrada se presenta a la red. Esta señal de entrada se propaga hacia adelante, neurona por neurona a través de la red y emerge en el extremo de salida de la red como señal de salida: y(n) = φ(v(n))donde v(n)está el campo local inducido de una neurona definido por v(n) =Σ w(n)y(n).La salida que se calcula en la capa de salida o (n) es en comparación con la respuesta deseada d(n)y encuentra el errore(n) para esa neurona. Los pesos sinápticos de la red durante este paso siguen siendo los mismos.

Pase hacia atrás:

La señal de error que se origina en la neurona de salida de esa capa se propaga hacia atrás a través de la red. Esto calcula el gradiente local para cada neurona en cada capa y permite que los pesos sinápticos de la red experimenten cambios de acuerdo con la regla delta como:

Δw(n) = η * δ(n) * y(n).

Este cálculo recursivo continúa, con el paso hacia adelante seguido del paso hacia atrás para cada patrón de entrada hasta que la red converja.

El paradigma de aprendizaje supervisado de un ANN es eficiente y encuentra soluciones a varios problemas lineales y no lineales, tales como clasificación, control de planta, pronóstico, predicción, robótica, etc.

Aprendizaje sin supervisión

Las redes neuronales autoorganizadas aprenden utilizando un algoritmo de aprendizaje no supervisado para identificar patrones ocultos en datos de entrada no etiquetados. Esto sin supervisión se refiere a la capacidad de aprender y organizar información sin proporcionar una señal de error para evaluar la solución potencial. La falta de dirección para el algoritmo de aprendizaje en el aprendizaje no supervisado puede ser ventajoso en algún momento, ya que permite que el algoritmo busque patrones que no se han considerado previamente. Las características principales de los Mapas autoorganizados (SOM) son:

  1. Transforma un patrón de señal entrante de dimensión arbitraria en un mapa bidimensional y realiza esta transformación de forma adaptativa
  2. La red representa la estructura de avance con una sola capa computacional que consiste en neuronas dispuestas en filas y columnas. En cada etapa de representación, cada señal de entrada se mantiene en su contexto adecuado y,
  3. Las neuronas que tratan con piezas de información estrechamente relacionadas están muy juntas y se comunican a través de conexiones sinápticas.

La capa computacional también se llama capa competitiva ya que las neuronas en la capa compiten entre sí para activarse. Por lo tanto, este algoritmo de aprendizaje se llama algoritmo competitivo. El algoritmo no supervisado en SOM funciona en tres fases:

Fase de competencia:

Para cada patrón de entrada x, presentado a la red, wse calcula el producto interno con peso sináptico y las neuronas en la capa competitiva encuentran una función discriminante que induce la competencia entre las neuronas y el vector de peso sináptico que está cerca del vector de entrada en la distancia euclidiana. se anuncia como ganador en la competencia. Esa neurona se llama la mejor neurona coincidente,

i.e. x = arg min ║x - w║.

Fase cooperativa:

La neurona ganadora determina el centro de un vecindario topológico hde neuronas cooperantes. Esto se realiza mediante la interacción lateral dentre las neuronas cooperativas. Este vecindario topológico reduce su tamaño durante un período de tiempo.

Fase adaptativa:

permite que la neurona ganadora y sus neuronas vecinas aumenten sus valores individuales de la función discriminante en relación con el patrón de entrada a través de ajustes sinápticos de peso adecuados,

 Δw = ηh(x)(x –w).

Tras la presentación repetida de los patrones de entrenamiento, los vectores de peso sinápticos tienden a seguir la distribución de los patrones de entrada debido a la actualización del vecindario y, por lo tanto, ANN aprende sin supervisor.

El modelo de autoorganización representa naturalmente el comportamiento neurobiológico y, por lo tanto, se usa en muchas aplicaciones del mundo real, como agrupación, reconocimiento de voz, segmentación de texturas, codificación vectorial, etc.

Referencia.


5

Siempre he encontrado que la distinción entre el aprendizaje no supervisado y supervisado es arbitraria y un poco confusa. No existe una distinción real entre los dos casos, sino que hay una variedad de situaciones en las que un algoritmo puede tener más o menos "supervisión". La existencia de aprendizaje semi-supervisado es un ejemplo obvio donde la línea es borrosa.

Tiendo a pensar en la supervisión como retroalimentación al algoritmo sobre qué soluciones se deben preferir. Para una configuración supervisada tradicional, como la detección de spam, usted le dice al algoritmo "no cometa errores en el conjunto de entrenamiento" ; para una configuración tradicional no supervisada, como la agrupación, le dice al algoritmo que "los puntos cercanos entre sí deben estar en el mismo grupo" . Sucede que la primera forma de retroalimentación es mucho más específica que la segunda.

En resumen, cuando alguien dice "supervisado", piense en la clasificación, cuando diga "no supervisado" piense en la agrupación e intente no preocuparse demasiado por eso más allá de eso.


2
La distinción está realmente bien definida y es simple. Ver la respuesta de David Robles.
bayer

3
Esa definición está bien hasta donde llega, pero es demasiado estrecha. ¿Qué pasa con el aprendizaje semi-supervisado? Es a la vez supervisado y sin supervisión. ¿Qué pasa con el condicionamiento de un prior en la inferencia bayesiana? Seguramente es una forma de supervisión. ¿Qué pasa con el tipo de inferencia utilizada en la traducción automática con un modelo de lenguaje (no supervisado) y un conjunto de pares de oraciones alineadas? La 'supervisión' es solo otra forma de sesgo inductivo.
Stompchicken

1
Veo tu punto, y lo encuentro bastante interesante. Sin embargo, no me preocuparía tanto. La distinción clásica no supervisada / supervisada abarca la mayoría de los casos.
bayer

4

Aprendizaje automático: explora el estudio y la construcción de algoritmos que pueden aprender y hacer predicciones sobre los datos. Estos algoritmos funcionan construyendo un modelo a partir de entradas de ejemplo para hacer predicciones o decisiones basadas en datos expresadas como salidas, en lugar de seguir estrictamente estáticas instrucciones del programa

Aprendizaje supervisado: es la tarea de aprendizaje automático de inferir una función a partir de datos de entrenamiento etiquetados. Los datos de entrenamiento consisten en un conjunto de ejemplos de entrenamiento. En el aprendizaje supervisado, cada ejemplo es un par que consiste en un objeto de entrada (típicamente un vector) y un valor de salida deseado (también llamado señal de supervisión). Un algoritmo de aprendizaje supervisado analiza los datos de entrenamiento y produce una función inferida, que puede usarse para mapear nuevos ejemplos.

La computadora se presenta con entradas de ejemplo y sus salidas deseadas, proporcionadas por un "maestro", y el objetivo es aprender una regla general que mapee las entradas a las salidas. Específicamente, un algoritmo de aprendizaje supervisado toma un conjunto conocido de datos de entrada y respuestas conocidas a los datos (salida), y entrena un modelo para generar predicciones razonables para la respuesta a nuevos datos.

Aprendizaje sin supervisión: es aprender sin un maestro. Una cosa básica que puede querer hacer con los datos es visualizarlos. Es la tarea de aprendizaje automático inferir una función para describir la estructura oculta a partir de datos no etiquetados. Dado que los ejemplos dados al alumno no están etiquetados, no hay señal de error o recompensa para evaluar una posible solución. Esto distingue el aprendizaje no supervisado del aprendizaje supervisado. El aprendizaje no supervisado utiliza procedimientos que intentan encontrar particiones naturales de patrones.

Con el aprendizaje no supervisado no hay retroalimentación basada en los resultados de la predicción, es decir, no hay un maestro que lo corrija. Bajo los métodos de aprendizaje no supervisados ​​no se proporcionan ejemplos etiquetados y no hay una noción del resultado durante el proceso de aprendizaje. Como resultado, depende del esquema / modelo de aprendizaje encontrar patrones o descubrir los grupos de datos de entrada.

Debe usar métodos de aprendizaje no supervisados ​​cuando necesite una gran cantidad de datos para entrenar sus modelos, y la disposición y la capacidad de experimentar y explorar, y, por supuesto, un desafío que no está bien resuelto a través de métodos más establecidos. Es posible aprender modelos más grandes y complejos que con el aprendizaje supervisado. Aquí hay un buen ejemplo al respecto

.


4

Aprendizaje supervisado: digamos que un niño va al jardín de niños. Aquí el maestro le muestra 3 juguetes: casa, pelota y auto. ahora el maestro le da 10 juguetes. los clasificará en 3 cajas de casa, pelota y auto según su experiencia previa. Por lo tanto, los maestros supervisaron al niño por primera vez para obtener las respuestas correctas para algunas series. Luego fue probado en juguetes desconocidos. Automóvil club británico

Aprendizaje no supervisado: de nuevo ejemplo de jardín de infantes. Un niño recibe 10 juguetes. se le dice que segmente unos similares. así que basándose en características como forma, tamaño, color, función, etc., intentará hacer que 3 grupos digan A, B, C y agruparlos. cama y desayuno

La palabra Supervisar significa que está dando supervisión / instrucción a la máquina para ayudarla a encontrar respuestas. Una vez que aprende las instrucciones, puede predecir fácilmente un nuevo caso.

Sin supervisión significa que no hay supervisión o instrucción sobre cómo encontrar respuestas / etiquetas y la máquina usará su inteligencia para encontrar algún patrón en nuestros datos. Aquí no hará predicciones, solo intentará encontrar grupos que tengan datos similares.


4

Ya hay muchas respuestas que explican las diferencias en detalle. Encontré estos gifs en codeacademy y a menudo me ayudan a explicar las diferencias de manera efectiva.

Aprendizaje supervisado

ingrese la descripción de la imagen aquí Observe que las imágenes de entrenamiento tienen etiquetas aquí y que el modelo está aprendiendo los nombres de las imágenes.

Aprendizaje sin supervisión

ingrese la descripción de la imagen aquí Tenga en cuenta que lo que se está haciendo aquí es solo agrupar (agrupar) y que el modelo no sabe nada sobre ninguna imagen.


4

El algoritmo de aprendizaje de una red neuronal puede ser supervisado o no supervisado.

Se dice que una red neuronal aprende supervisada si ya se conoce la salida deseada. Ejemplo: asociación de patrones

Las redes neuronales que aprenden sin supervisión no tienen tales salidas objetivo. No se puede determinar cómo será el resultado del proceso de aprendizaje. Durante el proceso de aprendizaje, las unidades (valores de peso) de dicha red neuronal se "arreglan" dentro de un cierto rango, dependiendo de los valores de entrada dados. El objetivo es agrupar unidades similares en ciertas áreas del rango de valores. Ejemplo: clasificación de patrones


3

Aprendizaje supervisado, dados los datos con una respuesta.

Dado el correo electrónico etiquetado como spam / no spam, aprenda un filtro de spam.

Dado un conjunto de datos de pacientes diagnosticados con diabetes o no, aprenda a clasificar a los nuevos pacientes con diabetes o no.

El aprendizaje no supervisado, dada la información sin respuesta, permite que la PC agrupe las cosas.

Dado un conjunto de artículos de noticias encontrados en la web, agrúpelos en un conjunto de artículos sobre la misma historia.

Dada una base de datos de datos personalizados, descubra automáticamente segmentos de mercado y agrupe clientes en diferentes segmentos de mercado.

Referencia


3

Aprendizaje supervisado

En esto, cada patrón de entrada que se utiliza para entrenar la red está asociado con un patrón de salida, que es el patrón objetivo o deseado. Se supone que un maestro está presente durante el proceso de aprendizaje, cuando se hace una comparación entre la salida calculada de la red y la salida esperada correcta, para determinar el error. El error se puede usar para cambiar los parámetros de red, lo que da como resultado una mejora en el rendimiento.

Aprendizaje sin supervisión

En este método de aprendizaje, el resultado objetivo no se presenta a la red. Es como si no hubiera un maestro para presentar el patrón deseado y, por lo tanto, el sistema aprende por sí mismo descubriendo y adaptándose a las características estructurales en los patrones de entrada.


3

Aprendizaje supervisado : proporciona datos de ejemplo etiquetados de forma variada como entrada, junto con las respuestas correctas. Este algoritmo aprenderá de él y comenzará a predecir resultados correctos basados ​​en las entradas posteriores. Ejemplo : filtro de correo electrónico no deseado

Aprendizaje no supervisado : solo da datos y no dice nada, como etiquetas o respuestas correctas. El algoritmo analiza automáticamente patrones en los datos. Ejemplo : Google News


3

Trataré de mantenerlo simple.

Aprendizaje supervisado: en esta técnica de aprendizaje, se nos proporciona un conjunto de datos y el sistema ya conoce la salida correcta del conjunto de datos. Entonces, aquí, nuestro sistema aprende prediciendo un valor propio. Luego, realiza una verificación de precisión utilizando una función de costo para verificar qué tan cerca estaba su predicción de la salida real.

Aprendizaje sin supervisión: en este enfoque, tenemos poco o ningún conocimiento de cuál sería nuestro resultado. Entonces, en cambio, derivamos la estructura de los datos donde no sabemos el efecto de la variable. Hacemos estructura agrupando los datos en función de la relación entre la variable en los datos. Aquí, no tenemos comentarios basados ​​en nuestra predicción.


2

Aprendizaje supervisado

Tiene entrada xy una salida objetivo t. Entonces entrenas el algoritmo para generalizar a las partes que faltan. Se supervisa porque se da el objetivo. Usted es el supervisor que le dice al algoritmo: para el ejemplo x, debe generar t!

Aprendizaje sin supervisión

Aunque la segmentación, la agrupación y la compresión generalmente se cuentan en esta dirección, me resulta difícil encontrar una buena definición para ello.

Tomemos los codificadores automáticos para la compresión como ejemplo. Si bien solo tiene la entrada x dada, es el ingeniero humano quien le dice al algoritmo que el objetivo también es x. Entonces, en cierto sentido, esto no es diferente del aprendizaje supervisado.

Y para la agrupación y la segmentación, no estoy muy seguro de si realmente se ajusta a la definición de aprendizaje automático (ver otra pregunta ).


2

Aprendizaje supervisado: ha etiquetado los datos y tiene que aprender de ellos. por ejemplo, datos de la casa junto con el precio y luego aprender a predecir el precio

Aprendizaje no supervisado: debe encontrar la tendencia y luego predecir, sin etiquetas previas. por ejemplo, diferentes personas en la clase y luego viene una nueva persona, entonces, ¿a qué grupo pertenece este nuevo estudiante?


1

En el aprendizaje supervisado sabemos cuáles deberían ser las entradas y salidas. Por ejemplo, dado un conjunto de autos. Tenemos que averiguar cuáles son rojos y cuáles azules.

Mientras que el aprendizaje no supervisado es donde tenemos que encontrar la respuesta con muy poco o sin tener idea de cómo debería ser la salida. Por ejemplo, un alumno podría ser capaz de construir un modelo que detecte cuándo las personas sonríen basándose en la correlación de patrones faciales y palabras como "¿por qué sonríes?".


1

El aprendizaje supervisado puede etiquetar un nuevo elemento en una de las etiquetas capacitadas en función del aprendizaje durante la capacitación. Debe proporcionar un gran número de conjunto de datos de entrenamiento, conjunto de datos de validación y conjunto de datos de prueba. Si proporciona digamos vectores de imagen de píxeles de dígitos junto con datos de entrenamiento con etiquetas, entonces puede identificar los números.

El aprendizaje no supervisado no requiere conjuntos de datos de entrenamiento. En el aprendizaje no supervisado, puede agrupar elementos en diferentes grupos según la diferencia en los vectores de entrada. Si proporciona vectores de imagen de píxeles de dígitos y le pide que los clasifique en 10 categorías, puede hacerlo. Pero sí sabe cómo etiquetarlo, ya que no ha proporcionado etiquetas de capacitación.


1

El aprendizaje supervisado es básicamente donde tiene variables de entrada (x) y variable de salida (y) y utiliza un algoritmo para aprender la función de mapeo de entrada a salida. La razón por la que llamamos a esto como supervisado es porque el algoritmo aprende del conjunto de datos de entrenamiento, el algoritmo hace predicciones de manera iterativa sobre los datos de entrenamiento. Supervisado tiene dos tipos: clasificación y regresión. La clasificación es cuando la variable de salida es una categoría como sí / no, verdadero / falso. La regresión es cuando la salida es valores reales como altura de persona, temperatura, etc.

El aprendizaje supervisado de la ONU es donde solo tenemos datos de entrada (X) y ninguna variable de salida. Esto se llama aprendizaje no supervisado porque, a diferencia del aprendizaje supervisado anterior, no hay respuestas correctas y no hay un maestro. Los algoritmos se dejan a sus propios dispositivos para descubrir y presentar la estructura interesante en los datos.

Los tipos de aprendizaje no supervisado son agrupación y asociación.


1

El aprendizaje supervisado es básicamente una técnica en la que los datos de entrenamiento de los cuales la máquina aprende ya están etiquetados, lo que supone un simple clasificador de números pares e impares donde ya ha clasificado los datos durante el entrenamiento. Por lo tanto, utiliza datos "ETIQUETADOS".

El aprendizaje no supervisado, por el contrario, es una técnica en la que la máquina por sí misma etiqueta los datos. O puede decir que es así cuando la máquina aprende sola desde cero.


1

En Simple Supervised learning es un tipo de problema de aprendizaje automático en el que tenemos algunas etiquetas y al usar esas etiquetas implementamos algoritmos como la regresión y la clasificación. La clasificación se aplica cuando nuestra salida es como 0 o 1, verdadero / falso, sí No. y se aplica la regresión donde se pone un valor real como una casa de precio

El aprendizaje no supervisado es un tipo de problema de aprendizaje automático en el que no tenemos etiquetas, lo que significa que solo tenemos algunos datos, datos no estructurados y tenemos que agrupar los datos (agrupación de datos) utilizando varios algoritmos no supervisados


1

Aprendizaje automático supervisado

"El proceso de un algoritmo que aprende del conjunto de datos de entrenamiento y predice el resultado".

Precisión del resultado previsto directamente proporcional a los datos de entrenamiento (longitud)

El aprendizaje supervisado es donde tiene variables de entrada (x) (conjunto de datos de entrenamiento) y una variable de salida (Y) (conjunto de datos de prueba) y utiliza un algoritmo para aprender la función de mapeo de la entrada a la salida.

Y = f(X)

Tipos principales:

  • Clasificación (eje y discreto)
  • Predictivo (eje y continuo)

Algoritmos

  • Algoritmos de clasificación:

    Neural Networks  
    Naïve Bayes classifiers  
    Fisher linear discriminant  
    KNN 
    Decision Tree 
    Super Vector Machines
    
  • Algoritmos Predictivos:

    Nearest  neighbor  
    Linear Regression,Multi Regression 
    

Áreas de aplicación:

  1. Clasificación de correos electrónicos como spam
  2. Clasificación de si el paciente tiene enfermedad o no
  3. Reconocimiento de voz

  4. Predecir el HR seleccionar candidato particular o no

  5. Predecir el precio del mercado de valores.


1

Aprendizaje supervisado :

Un algoritmo de aprendizaje supervisado analiza los datos de entrenamiento y produce una función inferida, que puede usarse para mapear nuevos ejemplos.

  1. Proporcionamos datos de capacitación y sabemos la salida correcta para una determinada entrada.
  2. Conocemos la relación entre entrada y salida.

Categorías de problema:

Regresión: Predecir resultados dentro de una salida continua => asignar variables de entrada a alguna función continua.

Ejemplo:

Dada una foto de una persona, predice su edad

Clasificación: Predecir resultados en una salida discreta => asignar variables de entrada en categorías discretas

Ejemplo:

¿Es este tumérico canceroso?

Aprendizaje supervisado

Aprendizaje sin supervisión:

El aprendizaje no supervisado aprende de los datos de las pruebas que no han sido etiquetados, clasificados o categorizados. El aprendizaje no supervisado identifica elementos comunes en los datos y reacciona en función de la presencia o ausencia de dichos elementos comunes en cada nueva pieza de datos.

  1. Podemos derivar esta estructura agrupando los datos en función de las relaciones entre las variables en los datos.

  2. No hay comentarios basados ​​en los resultados de la predicción.

Categorías de problema:

Agrupación: es la tarea de agrupar un conjunto de objetos de tal manera que los objetos en el mismo grupo (llamado agrupación) sean más similares (en cierto sentido) entre sí que con los de otros grupos (agrupaciones)

Ejemplo:

Tome una colección de 1.000.000 genes diferentes, y encontrar una forma de agrupar automáticamente estos genes en grupos que son de alguna manera similar o relacionado por diferentes variables, como la esperanza de vida, la ubicación, funciones, y así sucesivamente .

Aprendizaje sin supervisión

Los casos de uso populares se enumeran aquí.

¿Diferencia entre clasificación y agrupamiento en minería de datos?

Referencias

Aprendizaje supervisado

Aprendizaje sin supervisión

aprendizaje automático de coursera

hacia la ciencia


1

Aprendizaje supervisado

ingrese la descripción de la imagen aquí

Aprendizaje sin supervisión

ingrese la descripción de la imagen aquí

Ejemplo:

Aprendizaje supervisado:

  • Una bolsa con manzana
  • Una bolsa con naranja

    => modelo de construcción

  • Una bolsa mixta de manzana y naranja.

    => Por favor clasifique

Aprendizaje sin supervisión:

  • Una bolsa mixta de manzana y naranja.

    => modelo de construcción

  • Otra bolsa mixta

    => Por favor clasifique


1

En palabras simples .. :) Es mi entendimiento, siéntase libre de corregir. El aprendizaje supervisado es, sabemos lo que estamos prediciendo sobre la base de los datos proporcionados. Entonces tenemos una columna en el conjunto de datos que necesita ser predicada. El aprendizaje no supervisado es que tratamos de extraer el significado del conjunto de datos proporcionado. No tenemos claridad sobre qué predecir. Entonces, la pregunta es ¿por qué hacemos esto? .. :) La respuesta es: el resultado del aprendizaje no supervisado es grupos / grupos (datos similares juntos). Entonces, si recibimos datos nuevos, los asociamos con el clúster / grupo identificado y entendemos sus características.

Espero que te ayude.


1

aprendizaje supervisado

El aprendizaje supervisado es donde conocemos el resultado de la entrada sin formato, es decir, los datos se etiquetan de modo que durante el entrenamiento del modelo de aprendizaje automático comprenderá lo que necesita detectar en el resultado de salida, y guiará el sistema durante el entrenamiento para detectar los objetos pre-etiquetados sobre esa base detectará los objetos similares que hemos proporcionado en el entrenamiento.

Aquí los algoritmos sabrán cuál es la estructura y el patrón de los datos. El aprendizaje supervisado se utiliza para la clasificación.

Como ejemplo, podemos tener diferentes objetos cuyas formas son cuadradas, circulares, triangulares, nuestra tarea es organizar los mismos tipos de formas que el conjunto de datos etiquetado tiene todas las formas etiquetadas, y entrenaremos el modelo de aprendizaje automático en ese conjunto de datos, en basado en la fecha de entrenamiento comenzará a detectar las formas.

Aprendizaje sin supervisión

El aprendizaje no supervisado es un aprendizaje no guiado en el que no se conoce el resultado final, agrupará el conjunto de datos y, basándose en propiedades similares del objeto, dividirá los objetos en diferentes grupos y detectará los objetos.

Aquí los algoritmos buscarán el patrón diferente en los datos sin procesar y, en función de eso, agruparán los datos. El aprendizaje no supervisado se utiliza para la agrupación.

Como ejemplo, podemos tener diferentes objetos de múltiples formas cuadrado, círculo, triángulo, por lo que los racimos se basarán en las propiedades del objeto, si un objeto tiene cuatro lados, lo considerará cuadrado, y si tiene tres lados, triángulo y si no hay lados que no sean círculos, aquí los datos no están etiquetados, aprenderá a detectar las diferentes formas


1

El aprendizaje automático es un campo en el que intenta hacer que la máquina imite el comportamiento humano.

Usted entrena la máquina como un bebé. La forma en que los humanos aprenden, identifican características, reconocen patrones y se entrenan a sí mismos, de la misma manera que entrena la máquina alimentando datos con varias características. El algoritmo de la máquina identifica el patrón dentro de los datos y lo clasifica en una categoría particular.

Aprendizaje automático ampliamente dividido en dos categorías, aprendizaje supervisado y no supervisado.

El aprendizaje supervisado es el concepto en el que tiene datos / vectores de entrada con el valor objetivo correspondiente (salida). Por otro lado, el aprendizaje no supervisado es el concepto en el que solo tiene vectores / datos de entrada sin ningún valor objetivo correspondiente.

Un ejemplo de aprendizaje supervisado es el reconocimiento de dígitos escritos a mano, donde tiene una imagen de dígitos con el dígito correspondiente [0-9], y un ejemplo de aprendizaje no supervisado es agrupar clientes por comportamiento de compra.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.