Recientemente me encontré con Tesseract y OpenCV . Parece que Tesseract es un motor de OCR completo y OpenCV se puede utilizar como marco para crear una aplicación / servicio de OCR.
Intenté usar Tesseract en algunas de mis imágenes y su precisión parece decente. Más tarde, encontré un tutorial muy simple sobre el uso de OpenCV para realizar OCR usando Python y quedé impresionado. En unos minutos terminé de entrenar el sistema y su precisión fue buena. Pero, por supuesto, adoptar este enfoque significa que necesito entrenar mi sistema extensamente utilizando un gran conjunto de entrenamiento.
Mis preguntas específicas son las siguientes:
- ¿Cómo se elige entre Tesseract y OpenCV para crear una aplicación OCR personalizada?
- Hay conjuntos de datos de entrenamiento disponibles para Tesseract para diferentes idiomas. ¿OpenCV tiene algo similar para que no tenga que empezar desde cero para lograr OCR?
- ¿Cuál es mejor para una aplicación comercial aspirante?
¿Alguna sugerencia?