He visto algunos libros electrónicos / documentos que aparentemente fueron escaneados de sus versiones en papel, pero el texto en los libros electrónicos / documentos se puede copiar increíblemente. Supongo que las versiones escaneadas directamente deben haber sido procesadas por algún software de reconocimiento óptico de caracteres.
Entonces, me gustaría saber cuáles son los softwares de reconocimiento óptico de caracteres recomendados. ¿Especialmente aquellos que son para Ubuntu o gratis? Si los de Windows son mucho más superiores, házmelo saber también.
Estoy particularmente interesado en esos OCR que pueden aceptar un archivo pdf escaneado como entrada y aún producir como salida otro archivo pdf que se ve igual que el de entrada pero con su texto copiable.
¡Gracias y saludos!
Por favor, limite un software por respuesta