Soy muy nuevo en el procesamiento de imágenes y lo que intento hacer es eliminar el ruido de las captchas;
Para captchas, tengo diferentes tipos de ellos:
Para el primero lo que hice es:
En primer lugar, convertí cada píxel que no es negro al negro. Luego, encontré un patrón que es un ruido de la imagen y lo eliminé. Para el primer captcha, fue fácil borrarlo y encontré el texto con tesseract.
Pero estoy buscando una solución para el segundo y el tercero.
¿Cómo debe ser esto? Quiero decir, ¿cuáles son los métodos posibles para borrarlo?
Así es como borro patrones:
def delete(searcher,h2,w2):
h = h2
w = w2
search = searcher
search = search.convert("RGBA")
herear = np.asarray(search)
bigar = np.asarray(imgCropped)
hereary, herearx = herear.shape[:2]
bigary, bigarx = bigar.shape[:2]
stopx = bigarx - herearx + 1
stopy = bigary - hereary + 1
pix = imgCropped.load()
for x in range(0, stopx):
for y in range(0, stopy):
x2 = x + herearx
y2 = y + hereary
pic = bigar[y:y2, x:x2]
test = (pic == herear)
if test.all():
for q in range(h):
for k in range(w):
pix[x+k,y+q] = (255,255,255,255)
Perdón por los nombres de las variables, solo estaba probando la función.
Gracias..