Conversión de imagen monocroma (1 bit en blanco y negro)


12

Al convertir el texto escaneado en una imagen en blanco y negro de 1 bit, ¿cuáles son algunos filtros que se pueden aplicar en el proceso para mejorar el resultado? En este momento me encuentro con el problema de que los errores de oscilación hacen que la imagen se vea horrible.

Actualización: creo que intentar deshacer el dithering es un problema mucho más difícil. ¿Cómo puedo convertir la primera imagen en una imagen monocroma? El enfoque predeterminado convert -monochrome img1 img2se muestra a continuación. También probé un enfoque de dos pasos: 1) disminuir la profundidad (paleta de colores) y gamma 2) convertir a una imagen de dos niveles (no se muestra). Otras cosas con las que jugué incluyeron el dither ordenado de imagemagick (en varias configuraciones), pero no fue tan bueno como el enfoque de dos pasos.

imagen de texto imagen monocroma


1
Agregar más detalles o ejemplos de lo que está hablando le ayudaría a obtener algunas buenas respuestas.
Jason R el

Además, agregar una imagen facilitaría la comprensión del problema
mirror2image

Respuestas:


5

Yo sugeriría para este caso que muestree y aplique un ligero desenfoque y luego un enfoque, luego aplique la operación de umbral. No obtendrá más información de los datos de píxeles, simplemente no está allí. Pero obtendrá un resultado más suave de la operación de umbral, y no necesitará vacilar. El resultado final es como la degradación de una fotocopiadora.

Ejemplo:

resultado

Además, esto es lo que parece cuando usa un mejor algoritmo de difuminado de difusión;)

ingrese la descripción de la imagen aquí


Gracias, estaba pensando en usar el desenfoque, pero no sabía cómo, porque generalmente está destinado a reducir la calidad de la imagen. Si miramos la imagen difuminada, nos gustaría conectar píxeles cercanos. ¿Sería un desenfoque el único filtro que "conecta" los puntos? ¿Qué herramienta usaste para ese algoritmo de difuminado de difusión?
m33lky

El desenfoque solo tiene lugar después del muestreo ascendente (la imagen que publicó ya aparece muestreada 2x) para que no perdamos detalles de la imagen en el proceso. Este tramado proviene de Photoshop. Photoshop ofrece la opción para los modos de difuminado Difusión, Patrón o Ruido.
Matt M.

4

Lo que estás viendo se llama inestable . Teóricamente, el problema está mal planteado si desea reconstruir imágenes exactas antes de difuminar e imprimir. Sin embargo, se puede aplicar algo de filtrado lineal sobre una ventana más amplia (dependiendo de la cantidad de cuantificación del tramado). Por ejemplo, en su caso, puede tomar una colección de puntaje total de la ventana de 8x8 y aplicar la suma que le daría la intensidad en términos de 0-256.

El documento enumerado aquí es la solución a su problema exacto.

EDITAR:
Ok, si lo he entendido, ya que está escaneando la imagen en lugar de tomar una imagen digitalmente difuminada, su problema no es mucho de desvanecimiento. Respondí la primera parte antes de tu actualización.

Ok, en este caso, sugeriría que puede tener un proceso de dos pasos.

  1. encuentre un umbral óptimo para convertir la imagen en una imagen de dos niveles. La mejor manera de hacerlo es intentar encontrar el "valle entre las intensidades de blanco y negro dentro del histograma. Vea aquí los conceptos básicos sobre umbrales . Pero es posible que haya intentado esto también.

  2. Ahora, puede ver que algunos de los bordes pueden ser demasiado delgados o demasiado gruesos dependiendo del tipo de ruido. Entonces, para reconstruir una imagen más óptima, puede aplicar la morfología con operaciones como Dilatación y Erosión.

Vea esta presentación como referencia. Esto te dará una dirección de lo que estaba diciendo. Aquí hay una referencia sobre cómo aplicar varios filtros de morfología


Este es un gran documento, pero no es exactamente el problema, ya que comenzamos con la imagen antes de la interpolación.
Matt M.
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.