Control de voz sobre el entorno de escritorio


16

Me gustaría habilitar un sistema que pueda responder a los comandos de voz del usuario y ejecutar scripts de acuerdo con el comando verbal DADO.

Idealmente, me gustaría que la computadora escuchara constantemente.

Una vez que escuche la palabra de moda "Computadora" se activará y escuchará los comandos durante 10 segundos (más o menos).

Una vez activo, y mientras está escuchando, me gustaría que otro conjunto de palabras de moda pueda ejecutar scripts.

Por ejemplo....

(La computadora está inactiva) "Computadora" (la computadora escucha de inmediato) "Accede a nuevos MENSAJES" (los MENSAJES son palabras de moda * IGNORES "ACCESO NUEVO" - la computadora ejecuta un script y abre la evolución o la empatía). Podría haber uno para el navegador, uno para cerrar ventanas y mostrar el escritorio, o un montón de cosas realmente.

¿Es esto posible?

Respuestas:


7

Gnome-Voice-Control

Desarrollado como parte de Google Summer of Code 2007, esta fue una idea para desarrollar algunas características que mejorarán la usabilidad en el escritorio de Gnome.

El objetivo es implementar un sistema de control de voz de escritorio. El sistema consiste en una aplicación que monitoreará la entrada de audio (micrófono) y cuando se detecte una señal de audio significativa, el software captura, procesa y reconoce la señal y luego ejecuta la acción deseada sobre el Escritorio Gnome. En un conjunto de acciones podría incluir maximizar, minimizar, cerrar la ventana activa; abrir un programa específico; cambiar de un escritorio a otro; entre otros. GnomeVoiceControl se implementa en C junto con CMU Sphinx, que es una herramienta de código abierto, creada para convertir voz en texto.

Presentación de diapositivas de los autores.

Desafortunadamente, parece que no se ha desarrollado mucho más allá de los "objetivos" básicos, sin embargo, parece haber alguna actividad que agrega soporte para nuevos idiomas como el búlgaro y el turco este año.

Instalar:

sudo apt-get install gnome-voice-control

Ornitorrinco

Hay un proyecto interesante llamado ornitorrinco : básicamente es un front-end de Linux para Dragon Naturally Speaking que se ejecuta en Wine.

El reclamo a la fama de esta aplicación es "incluso puede iniciar programas y scripts de Windows o Linux, por ejemplo," terminal de inicio ".

Védicos

Este es un proyecto nuevo que dice que funciona con la interfaz de Unity.

La página del proyecto dice que reconoce "ejecutar [nombre del programa]", por lo que en teoría usted [nombre del programa] podría ser cualquier script que desee ejecutar.


Gracias por la respuesta excepcionalmente rápida. Escuché sobre ese programa y lo instalé, pero parece que no pasa la configuración, solo dice "config". Me sorprende que no se haya trabajado mucho en este frente. ¿Hay tal vez una ventana equivalente que podría correr con vino?
BorgDomination

1
La versión anterior de gnome voice que está en sináptica me dio los mismos resultados. Intenté lo último del sitio web y parecía ir más lejos, pero nunca conseguí que funcionara correctamente. Las dependencias manuales eran una molestia.
Kendrick

3

Simon escucha

Este es un proyecto de código abierto destinado a reemplazar el mouse y / o el teclado por reconocimiento de voz desarrollado inicialmente para personas con discapacidad física.

Hay un ppa desde donde podemos instalar la aplicación: ppa: grasch-simon-listenns / simon


¿Simon solo funciona con kde? Se ve realmente increíble y lo instalé, pero parece que no puedo hacerlo funcionar con gnome-shell. Especialmente gestión de ventanas. Si quiero mostrar todas las ventanas, por ejemplo, eso funcionará de manera diferente en kde env y gnome env ¿verdad?
Joshua Robison

1
Las dependencias deben resolverse al instalar en Ubuntu <= 12.04 desde el ppa pero no lo he intentado recientemente, y tampoco tengo idea de cómo puede interferir con el shell de GNOME. No hay una versión (todavía) para 12.10.
Takkat

3

Google2Ubuntu

Google2Ubuntu es una herramienta que le permite controlar su computadora mediante comandos de voz a través de la API de reconocimiento de voz de Google.

Ejecute los siguientes comandos en la terminal para instalar google2Ubuntu,

sudo add-apt-repository ppa:benoitfra/google2ubuntu
sudo apt-get update
sudo apt-get install google2ubuntu

Fuente


1

Reconocimiento de voz de Linux

Está siendo desarrollado para ejecutarse bajo distribuciones de Linux, es muy configurable y fácil de extender, admite diccionarios personalizados, reconocimiento basado en contexto, modo de dictado y macros configurables.

Para instalar Linux Speech Recognition, vaya a la página de GitHub del proyecto . Descargue el archivo ZIP y extráigalo.

Luego instale algunas dependencias:

sudo apt-get install sox python-argparse libsox-fmt-mp3 mutt xvkbd xautomation

Abra la carpeta extraída (Palaver-master) en la terminal y ejecute la configuración:

cd /~Path-to-folder~/Palaver-master/
./setup

Ahora es solo para asignar una tecla de acceso rápido para habilitar la grabación, para hacerlo, vaya a Configuración del sistema ...> Teclado> Accesos directos> Accesos directos personalizados, haga clic en el botón Más para agregar un acceso directo, asígnele el nombre Reconocimiento de voz y configure el comando para:

/~Path-to-folder~/Palaver-master/hotkey

Haga clic en Aplicar, haga clic sobre el acceso directo y luego asigne una tecla de acceso rápido para activar el reconocimiento de voz.

Tenga en cuenta que todavía no se ha lanzado una compilación estable, por lo que no espere que los comandos sean completamente funcionales en esta etapa, se reconocerán muchas frases, pero no se realizará ninguna acción real.


0

Snips.ai

Solo lo probé en pi3: parece tener posibles
Runs en Docker

https://snips.ai/


1
Bienvenido a Ask Ubuntu. Tenga en cuenta que si está afiliado a esta herramienta, debe decirlo explícitamente en su publicación; vea Cómo no ser un spammer .
Glorfindel

1
El sitio web oficial dice: Código abierto: estamos comprometidos a abrir Snips con el tiempo , por lo que vale la pena probar Snips.
karel
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.