¿Hay una clase de persona en ImageNet? ¿Hay clases relacionadas con los humanos?


14

Si miro una de las muchas fuentes para las clases de Imagenet en Internet, no puedo encontrar una sola clase relacionada con los seres humanos (y no, el hombre de la cosecha no es alguien que cosecha, pero es lo que yo conocía como papá de piernas largas, una especie de araña :-). ¿Cómo es eso posible? Tendría que esperar al menos una personclase, e incluso algo más específico como man, woman, toddler, etc. Nada de eso. ¿Por qué? ¿ Fei-Fei Li y su equipo tomaron la decisión consciente de no tener imágenes de personas en la base de datos? ¿Estoy mirando el archivo equivocado? En aras de la pregunta, podemos considerar las ImageNetversiones de 2014 en adelante.

Respuestas:


7

También puede ver aquí las etiquetas en la imagenet. Supongo que tienes razón, no hay una etiqueta para humanos en el conjunto de datos, pero hay algo que notar. Hay etiquetas en imagenet como vaquero o algunos sombreros específicos y otras cosas relacionadas con humanos como la camisa y la camiseta. Puedes echar un vistazo aquí y también aquí. En el último enlace, Yosinski et al., Ha intentado demostrar que el popular AlexNet ha aprendido a reconocer rostros humanos, aunque no hay una etiqueta como rostro humano en el conjunto de datos de imagenet. En su artículo, han investigado que las redes neuronales convolucionales pueden intentar aprender cosas que se distribuyen entre capas o tal vez no, y es posible que no tengan una etiqueta especial en los datos de entrenamiento. Como ejemplo, se puede hacer referencia a la cara de gatos y humanos. Además, como puede ver aquí, tal vez el objetivo era el aprendizaje de atributos en conjuntos de datos a gran escala , como se cita en la última línea de la página, como referencia.


Me gusta la respuesta, pero no entiendo tu última oración. ¿Qué quiere decir con aprendizaje de atributos, cómo difiere (si difiere) de la clasificación de imágenes y cómo se relaciona esto con mi pregunta (¿hay personclases en ImageNet)?
DeltaIV

@DeltaIV Quise decir en el último enlace que proporcioné, hay una referencia que en ese trabajo, discuten este tema. Lo que dije fue como aprender caras, que no son las etiquetas, pero tal vez sean necesarias para entender las camisetas.
Medios de comunicación

Ok, los NN aprenden características que parecen caras porque ayudan a reconocer (o distinguir entre) las etiquetas. Sí, como que esperaba eso. Gracias
DeltaIV

@DeltaIV Supongo que esto es quizás lo que llamamos aprendizaje
Medios

2
Creo que aprender para redes neuronales tiene muy poco que ver con el proceso de aprendizaje humano. Ver estas alucinaciones . Por otra parte, la misma idea de que estas imágenes optimizadas deberían mostrar lo que las Redes Neurales han aprendido, es profundamente defectuosa y se basa en un malentendido de lo que es una distribución de probabilidad de alta dimensión. El tema es muy delicado: mi pregunta era mucho más elemental.
DeltaIV

6

Encontré que la clase 7846 (name = "n00007846") es para persona. Para acceder a la descripción de la clase, lea http://image-net.org/download-API . Aún mejor, los siguientes archivos de texto contienen todo lo que necesita para comprender las clases en el conjunto de datos de ImageNet (clase = ID de WordNet):

n00007846 se asigna a persona, individuo, alguien, alguien, mortal, alma . El brillo correspondiente es: un ser humano; "había demasiado para una persona que hacer" .


¿Podría vincular a una fuente? Eso sería útil para otros usuarios.
Elias Strehle

Los modelos de Imagenet parecen tener un rendimiento inferior en humanos de diversos orígenes. En mis datos, hay personas que usan atuendos y se identifican principalmente como pelotas de rugby y voleibol.
Levesque

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.