¿Cuál es la diferencia entre Multiclass y Multilabel Problem?


52

¿Cuál es la diferencia entre un problema multiclase y un problema multicabel?


Ambas tareas se pueden lograr con el paquete de software Vowpal Wabbit (línea de comandos, enlaces de Python disponibles).
Vladislavs Dovgalecs

Aprendí este concepto y construí mi entendimiento con esta publicación , explicaron la clasificación de etiquetas múltiples de una manera muy elegante.
user235077

Respuestas:


45

Sospecho que la diferencia es que en los problemas de varias clases las clases son mutuamente excluyentes, mientras que para los problemas de múltiples etiquetas cada etiqueta representa una tarea de clasificación diferente, pero las tareas están de alguna manera relacionadas (por lo que hay un beneficio en abordarlas juntas en lugar de por separado) ) Por ejemplo, en el famoso conjunto de datos de cangrejos leptograspus hay ejemplos de machos y hembras de dos colores de cangrejo. Podría abordar esto como un problema de varias clases con cuatro clases (azul masculino, azul femenino, naranja masculino, naranja femenino) o como un problema de etiqueta múltiple, donde una etiqueta sería hombre / mujer y la otra azul /naranja. Esencialmente, en problemas de etiquetas múltiples, un patrón puede pertenecer a más de una clase.


@Dirkran Gracias por tu explicación. ¿Conoce alguna otra fuente donde puedo conseguir Multilabel conjunto de datos que no sea csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/multilabel.html y mulan.sourceforge.net/datasets.html
Estudiantes

@Learner, lo siento, no es algo en lo que haya trabajado mucho. Es posible que desee echar un vistazo al aprendizaje de tareas múltiples, que tiene algunas similitudes con el aprendizaje de etiquetas múltiples. Quizás algunos de los conjuntos de datos utilizados para eso también podrían ser útiles como puntos de referencia para el aprendizaje de etiquetas múltiples.
Dikran Marsupial

26

La clasificación multiclase significa una tarea de clasificación con más de dos clases; por ejemplo, clasifique un conjunto de imágenes de frutas que pueden ser naranjas, manzanas o peras. La clasificación multiclase supone que cada muestra está asignada a una sola etiqueta: una fruta puede ser una manzana o una pera, pero no ambas al mismo tiempo.

La clasificación de múltiples etiquetas asigna a cada muestra un conjunto de etiquetas de destino. Esto puede considerarse como propiedades de predicción de un punto de datos que no son mutuamente excluyentes, como los temas que son relevantes para un documento. Un texto puede ser sobre religión, política, finanzas o educación al mismo tiempo o ninguno de estos.

Tomado de http://scikit-learn.org/stable/modules/multiclass.html


18

Para complementar las otras respuestas, aquí hay algunas cifras. Una fila = la salida esperada para una muestra.

Multiclase

Una columna = una clase (codificación hot-one)

ingrese la descripción de la imagen aquí

Multilabel

Una columna = una clase

ingrese la descripción de la imagen aquí


Ves eso:

  • en el caso de múltiples etiquetas, a una muestra se le puede asignar más de una clase.
  • en el caso multiclase, hay más de 2 clases en total.

Como nota al margen, nada le impide tener un problema de clasificación multi-salida-multiclase , por ejemplo:

ingrese la descripción de la imagen aquí


7

Un problema de varias clases tiene la asignación de instancias a una de una colección de clases finita y mutuamente excluyente. Como en el ejemplo ya dado de cangrejos (de @Dikran): azul macho, azul hembra, naranja macho, naranja hembra. Cada uno de estos es exclusivo de los demás y, en conjunto, son integrales.

Una forma de problema de múltiples etiquetas es dividirlas en dos etiquetas, sexo y color; donde el sexo puede ser masculino o femenino, y el color puede ser azul o naranja. Pero tenga en cuenta que este es un caso especial del problema de las etiquetas múltiples, ya que cada instancia obtendrá cada etiqueta (es decir, cada cangrejo tiene un sexo y un color).

Los problemas de etiquetas múltiples también incluyen otros casos que permiten asignar un número variable de etiquetas a cada instancia. Por ejemplo, un artículo en un periódico o servicio de cable puede asignarse a las categorías NOTICIAS, POLÍTICAS, DEPORTES, MEDICINA, etc. Una historia sobre un evento deportivo importante obtendría una asignación de la etiqueta DEPORTES; mientras que otro, que involucra tensiones políticas que se revelan en un evento deportivo en particular, podría obtener las etiquetas SPORTS y POLITICS. Donde estoy, en los Estados Unidos, los resultados del Superbowl están etiquetados como DEPORTES y NOTICIAS dado el impacto social del evento.

Tenga en cuenta que esta forma de etiquetado, con un número variable de etiquetas, se puede volver a convertir en una forma similar al ejemplo con los cangrejos; excepto que cada etiqueta se trata como LABEL-X o no como LABEL-X. Pero no todos los métodos requieren esta refundición.


2

Y una diferencia más radica en que el problema de las etiquetas múltiples requiere que el modelo aprenda la correlación entre las diferentes clases, pero en los problemas multiclase las diferentes clases son independientes entre sí.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.