Se llama el acto de extraer texto de las imágenes OCR
y Ubuntu tiene una página wiki dedicada a OCR . De esa página:
Herramientas de OCR disponibles
Los repositorios de Ubuntu Universe contienen las siguientes herramientas de OCR:
- gocr : un OCR de línea de comando
- fuzzyocr - plugin spamassassin para verificar archivos adjuntos de imágenes
- libhocr0 - OCR hebreo
- ocrad - Programa de reconocimiento óptico de caracteres
- ocrfeeder : sistema de análisis de diseño de documentos y reconocimiento óptico de caracteres
- ocropus - análisis de documentos y sistema OCR
- tesseract-ocr
Los repositorios de Ubuntu multiverse también contienen:
- cuneiforme - sistema de OCR multilingüe
Algunos paquetes están desactualizados, pero se pueden encontrar nuevos no oficiales en Alex_P PPA (código de adición de PPA: ppa: alex-p / notesalexp). Si nunca usó un PPA, verifique cómo agregar software desde un PPA .
editar: Como se muestra en el comentario, Clara OCR también existe, pero se quedó genial en Hardy y su sitio web tiene 2009 como última actualización.