¿Cuál es la diferencia entre una característica y una etiqueta?


100

Estoy siguiendo un tutorial sobre los conceptos básicos del aprendizaje automático y se menciona que algo puede ser una característica o una etiqueta .

Por lo que sé, una característica es una propiedad de los datos que se utilizan. No puedo entender cuál es la etiqueta, sé el significado de la palabra, pero quiero saber qué significa en el contexto del aprendizaje automático.


Las características son los campos que se utilizan como entrada y las etiquetas se utilizan como salida. Como ejemplo simple, considere cómo predecir si se debe vender un automóvil en función del kilometraje del automóvil, el año, etc. Sí / no es la etiqueta, mientras que el kilometraje y el año serían las características.
amcneil206

Respuestas:


199

Brevemente, la característica es entrada; se emite la etiqueta. Esto se aplica tanto a los problemas de clasificación como a los de regresión.

Una característica es una columna de los datos en su conjunto de entrada. Por ejemplo, si está tratando de predecir el tipo de mascota que alguien elegirá, sus características de entrada pueden incluir la edad, la región de origen, los ingresos familiares, etc. La etiqueta es la opción final, como perro, pez, iguana, roca, etc.

Una vez que haya entrenado su modelo, le proporcionará conjuntos de nuevas entradas que contengan esas características; devolverá la "etiqueta" prevista (tipo de mascota) para esa persona.


1
Entonces [edad, región de origen, ingreso familiar] sería "3 vectores de características". Y en Keras, ¿su matriz NumPy para su red LSTM sería [muestras, pasos de tiempo, 3]?
naisanza

1
@naisanza: esa es ciertamente una posibilidad. No estoy familiarizado con Keras, pero esta organización de alto nivel ciertamente podría ser el comienzo de una implementación válida.
Poda el

¿Característica y variable son lo mismo?
Debadatta

Me gustaría decir que "etiqueta" también depende del contexto; por ejemplo, para entrenar un modelo, utilizará datos "etiquetados". En este caso, la etiqueta es la verdad básica con la que se comparan los datos de salida.
N.Atanasov

Guau. gran respuesta, gracias, esto aclara muchas preguntas persistentes sobre este espacio temático.
Andrew Ray

31

Característica:

En Machine Learning, la función significa propiedad de sus datos de entrenamiento. O puede decir el nombre de una columna en su conjunto de datos de entrenamiento.

Suponga que este es su conjunto de datos de entrenamiento

Height   Sex   Age
 61.5     M     20
 55.5     F     30
 64.5     M     41
 55.5     F     51
 .     .     .
 .     .     .
 .     .     .
 .     .     .

Entonces aquí Height, Sexy Ageestán las características.

etiqueta:

El resultado que obtiene de su modelo después de entrenarlo se llama etiqueta.

Supongamos que alimentó el conjunto de datos anterior a algún algoritmo y genera un modelo para predecir el género como Masculino o Femenino. En el modelo anterior, pasa características como age, heightetc.

Entonces, después de calcular, devolverá el género como Masculino o Femenino. Eso se llama Etiqueta


5

Aquí viene un enfoque más visual para explicar el concepto. Imagina que quieres clasificar el animal que se muestra en una foto.

Las posibles clases de animales son, por ejemplo, gatos o pájaros. En ese caso, la etiqueta serían las posibles asociaciones de clases, por ejemplo, gato o pájaro, que predecirá su algoritmo de aprendizaje automático.

Las características son patrones, colores, formas que son parte de sus imágenes, por ejemplo, piel, plumas o interpretación de nivel más bajo, valores de píxeles.

Pájaro Etiqueta: Bird
Características: Plumas

Gato

Etiqueta: Cat
Características: Furr


5

Tomemos un ejemplo en el que queremos detectar el alfabeto usando fotos escritas a mano. Alimentamos estas imágenes de muestra en el programa y el programa clasifica estas imágenes en función de las características que obtuvieron.

Un ejemplo de una característica en este contexto es: la letra 'C'puede considerarse como una cóncava orientada hacia la derecha.

Ahora surge una pregunta sobre cómo almacenar estas características. Necesitamos nombrarlos. Este es el papel de la etiqueta que surge. Se asigna una etiqueta a dichas características para distinguirlas de otras características.

Por lo tanto, obtenemos etiquetas como salida cuando se proporcionan características como entrada .

Las etiquetas no están asociadas con el aprendizaje no supervisado.


4

Requisito previo: estadísticas básicas y exposición al aprendizaje automático (regresión lineal)

Se puede responder en una oración:

Son iguales pero su definición cambia según las necesidades.

Explicación

Déjame explicar mi declaración. Suponga que tiene un conjunto de datos, para este propósito considere exercise.csv. Cada columna del conjunto de datos se denomina características. Sexo, edad, altura, frecuencia cardíaca, temperatura corporal y calorías pueden ser una de las varias columnas. Cada columna representa características o propiedades distintas.

ejercicio.csv

User_ID  Gender Age  Height  Weight Duration    Heart_Rate  Body_Temp   Calories
14733363 male   68  190.0   94.0    29.0           105.0    40.8        231.0
14861698 female 20  166.0   60.0    14.0            94.0    40.3        66.0
11179863 male   69  179.0   79.0    5.0             88.0    38.7        26.0

Para solidificar la comprensión y aclarar el rompecabezas, tomemos dos problemas diferentes (caso de predicción).

CASO1: En este caso, podríamos considerar usar - Sexo, Altura y Peso para predecir las Calorías quemadas durante el ejercicio. Esa predicción (Y) Calorías aquí es una etiqueta . Calorías es la columna que desea predecir utilizando varias características como - x1: género, x2: altura y x3: peso .

CASO2: En el segundo caso aquí, podríamos querer predecir el Heart_rate usando Sexo y Peso como una característica. Aquí Heart_Rate es una etiqueta predicha usando características - x1: género y x2: peso .

Una vez que haya entendido la explicación anterior, ya no estará realmente confundido con Etiqueta y Características.


3

Una característica explicada brevemente sería la entrada que ha enviado al sistema y la etiqueta sería la salida que espera. Por ejemplo, ha alimentado muchas características de un perro como su altura, color de pelaje, etc., por lo que después de calcular, devolverá la raza del perro que desea conocer.


0

Suponga que desea predecir el clima, entonces las características que se le otorgan serían datos climáticos históricos, clima actual, temperatura, velocidad del viento, etc. y las etiquetas serían meses. La combinación anterior puede ayudarlo a derivar predicciones.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.