¿Cómo calcular el número de características en función de la resolución de la imagen?


18

Recién cubrí la hipótesis no lineal de Andrew Neg de Netowrks neuronales, y teníamos una pregunta de opción múltiple para determinar el número de características para una imagen de resolución 100x100 de intensidades de grescale .

Y la respuesta fue 50 millones, 5 x 107

Sin embargo, antes para una imagen de escala de grises de 50 x 50 píxeles. la cantidad de funciones es 50x50 (2500)

¿Por qué sería 5 x 107 lugar de 10,000 ?

Sin embargo, dice que incluye todos los términos cuadráticos ( xixj ) como características

Suponga que está aprendiendo a reconocer automóviles a partir de imágenes de 100 × 100 píxeles (escala de grises, no RGB). Deje que las características sean valores de intensidad de píxeles. Si entrena la regresión logística que incluye todos los términos cuadráticos ( ) como características, ¿aproximadamente cuántas características tendrá?xixj

y en la diapositiva anterior con respecto al 100x100, que las características cuadráticas ( x x j ) = 3 millones de características, pero todavía no puedo señalar la conexión.xixj

Respuestas:


16

Quizás un caso más simple aclarará las cosas. Digamos que elegimos una muestra de píxeles 1x2 en lugar de 100x100.

Píxeles de muestra de la imagen

+----+----+
| x1 | x2 |
+----+----+

Imagine que al trazar nuestro conjunto de entrenamiento, nos dimos cuenta de que no se puede separar fácilmente con un modelo lineal, por lo que elegimos agregar términos polinómicos para que se ajusten mejor a los datos.

Digamos que decidimos construir nuestros polinomios al incluir todas las intensidades de píxeles y todos los múltiplos posibles que se pueden formar a partir de ellos.

Como nuestra matriz es pequeña, enumeremoslas:

x1, x2, x12, x22, x1×x2, x2×x1

Al interpretar la secuencia de características anterior, se puede ver que hay un patrón. Los primeros dos términos, grupo 1, son características que consisten solo en su intensidad de píxeles. Los siguientes dos términos, grupo 2, son características que consisten en el cuadrado de su intensidad. Los dos últimos términos, grupo 3, son el producto de todas las combinaciones de intensidades de píxeles por pares (dos).

grupo 1: x1, x2

grupo 2: x12, x22

grupo 3: x1×x2, x2×x1

Pero espera, hay un problema. Si observa los términos del grupo 3 en la secuencia ( y x 2 × x 1 ) notará que son iguales. Recuerda nuestro ejemplo de vivienda. Imagina tener dos características x1 = pies cuadrados, y x2 = pies cuadrados, para la misma casa ... ¡Eso no tiene ningún sentido! Ok, entonces necesitamos deshacernos de la función duplicada, digamos arbitrariamente x 2 × x 1x1×x2x2×x1x2×x1 . Ahora podemos reescribir la lista de características del grupo tres como:

grupo 3: X1×X2

Contamos las características en los tres grupos y obtenemos 5.

Pero este es un ejemplo de juguete. Vamos a derivar una fórmula genérica para calcular el número de características. Usemos nuestros grupos originales de características como punto de partida.

syozmisolrotupag1+syozmisolrotupag2+syozmisolrotupag3=metro×norte+metro×norte+metro×norte=3×metro×norte

Ah! Pero tuvimos que deshacernos del producto duplicado en el grupo 3.

C(metro×norte,2)

Entonces nuestra fórmula genérica sería:

m×n+m×n+C(m×n,2)=2m×n+C(m×n,2)

Vamos a usarlo para calcular la cantidad de características en nuestro ejemplo de juguete:

2×1×2+C(1×2,2)=4+1=5

¡Eso es!


2
¡Ojalá esta explicación hubiera sido dada en la conferencia!
Ian Walker-Sperber

Me pregunto cómo se supone que debemos saber esto en el curso sin ser explicados
Mohammed Noureldin

6

Si está utilizando todas las características lineales y cuadráticas, se supone que el número total es:

100*100 + 100*100 + C(100*100,2) = 50015000
10000   + 10000   + 49995000     = 50015000
xi         xi^2       xixj

1
¿Puedes explicarlo un poco más? ¿Estás diciendo xi + xi ^ 2 + xixi? ¿Es xi = 100 y xj = 100? ¿Por qué xi y xi ^ 2 son 100 * 100? ¿Qué es C (100 * 100,2)?
Iancovici

44
(1) hay totalmente 100 * 100 píxeles, si está utilizando la intensidad como características, habrá 100 * 100 características en total, eso es xi; y (ii) también puede usar la densidad de potencia como una característica, es decir (xi, xi) o xi. ^ 2, todavía 100 * 100 en total; finalmente (iii) si usa las correlaciones entre dos píxeles, habrá C pares de píxeles en total, es decir (xi, xj), C es una combinación de matemáticas ( mathworld.wolfram.com/Combination.html )
lennon310

Gracias, una última pregunta es ¿por qué xi = xi ^ 2 en este contexto?
Iancovici

Usé xi para representar un solo píxel, y xi ^ 2 significa usar pares del mismo píxel (xi, xi). El número de píxeles individuales es el mismo que el de pares del mismo píxel. No tiene nada que ver con la intensidad de píxeles. Perdón por la confusion.
lennon310

La misma pregunta, unos años después. ¿No deberíamos tener en cuenta también los posibles valores de intensidad (de 0 a 255)?
albus_c

0

La idea de (X2) / 2 también podría funcionar para obtener las características cuadráticas. Entonces, si n = 2500, entonces sabemos que x (i) = 2500 y la sustitución de x en la fórmula dará 50 millones


2
yo obtengo 25002/ /23 millones, no 50millón.
whuber

0

@whuber 50 millones viene cuando tienes una imagen de 100 * 100 píxeles. donde cuadrado (100 * 100) = 100000000 (10 millones) y cuadrado (100 * 100) / 2 = 5 millones. Espero que esto responda.


Esta es una respuesta a un comentario y no una respuesta a esta pregunta.
Michael R. Chernick
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.