Reconocimiento de voz simple bajo Linux


15

¿Alguien tiene un tutorial simple para ejecutar el reconocimiento de voz en Linux? Veo que pocketsphinx está disponible como una descarga binaria en el centro de software, pero al ejecutarlo desde la terminal no se informa que necesita parámetros, pero no sé qué poner allí. Intenté instalar todos los modelos de voz enumerados, pero no sé dónde se guardan o cómo hacer que funcionen. Tampoco estaba seguro de qué hacer para que Sphinx3 funcionara. Las páginas de manual de Sphinx3 parecen rotas y la de pocketsphinx no tiene un uso de ejemplo que tenga sentido para mí.

Estoy buscando algo que obtenga un 60% de reconocimiento correcto de la entrada de micrófono con un vocabulario y palabras limitados, y luego puedo escribir eso en un archivo de texto; esto existió a fines de la década de 1980. Entonces, sé que existe y debería funcionar de alguna manera.

Gracias.

(La conexión a Internet de PS es un no ir)


Tenía problemas para conseguir simon-listens.org corriendo en Ubuntu última vez que lo intentaba, pero eso fue hace bastante tiempo, vale la pena que
david.libremone

1
Es posible que desee estipular si está bien requerir una conexión a Internet activa. El servicio de Google Voice acepta un archivo de audio y devuelve texto, pero no es capaz sin conexión.
RobotHumans

Internet activo es un no ir.
user2068060

1
La mejor manera de agregar información adicional a su pregunta es editándola, con el botón Editar . Es mejor visible de esa manera, y los comentarios son principalmente para fines secundarios y temporales. Los comentarios se eliminan en una variedad de circunstancias. Cualquier cosa importante para su pregunta debe estar en la pregunta misma.
Guntbert

Respuestas:


4

Prueba Simon escucha

Simon es un programa de reconocimiento de voz de código abierto y reemplaza el mouse y el teclado. Está diseñado para ser muy flexible y permite la personalización para cualquier aplicación donde se necesita reconocimiento de voz.

Para descargar y obtener más información, visite Simon en kde.org



0

La tasa de precisión depende de múltiples factores como el acento, los ruidos de fondo y la calidad de las grabaciones. Los modelos pre-entrenados son un poco limitados, y utilizaron Transcribear en lugar de una herramienta de voz a texto basada en navegador web en Linux para mis proyectos de transcripción.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.