Leí muchos artículos sobre Detección de objetos, Reconocimiento de objetos, Segmentación de objetos, Segmentación de imágenes y Segmentación de imágenes semánticas y aquí están mis conclusiones que podrían no ser ciertas:
Reconocimiento de objetos: en una imagen determinada, debe detectar todos los objetos (una clase restringida de objetos depende de su conjunto de datos), localizarlos con un cuadro delimitador y etiquetar ese cuadro delimitador con una etiqueta. En la imagen de abajo verá una salida simple de un reconocimiento de objetos de última generación.
Detección de objetos: es como el reconocimiento de objetos, pero en esta tarea solo tiene dos clases de clasificación de objetos, lo que significa cuadros delimitadores de objetos y cuadros delimitadores sin objetos. Por ejemplo, detección de automóviles: debe detectar todos los automóviles en una imagen determinada con sus cuadros delimitadores.
Segmentación de objetos: al igual que el reconocimiento de objetos, reconocerá todos los objetos en una imagen, pero su salida debe mostrar este objeto clasificando los píxeles de la imagen.
Segmentación de imagen: en la segmentación de imagen segmentará regiones de la imagen. su salida no etiquetará los segmentos y la región de una imagen que deben ser coherentes entre sí en el mismo segmento. Extraer superpíxeles de una imagen es un ejemplo de esta tarea o segmentación de primer plano y fondo.
Segmentación semántica: en la segmentación semántica, debe etiquetar cada píxel con una clase de objetos (automóvil, persona, perro, ...) y no objetos (agua, cielo, carretera, ...). En otras palabras, en Segmentación semántica, etiquetará cada región de la imagen.