Proyecto de texto a voz para un padre ciego


12

Mi primer post aquí. (Sinceramente espero que esté dentro del alcance de las publicaciones permitidas que no sabía a dónde recurrir).

Planeo hacer un proyecto para una madre de noventa años que está perdiendo la vista rápidamente y lleva una vida relativamente triste.

Ella se sienta sola en casa mirando el cable básico y no tiene conexión a Internet. Ella tiene un gran control remoto con 60 botones pequeños y está básicamente confundida por todo.

Solo quiero poner en un disco duro una biblioteca de películas y / o audiolibros para que pueda navegar a través de ellos y mirar a su gusto.

He decidido que necesita un joystick simple con 6 botones configurables grandes. Necesitaría descubrir de alguna manera que los títulos se leen automáticamente (mientras se desplaza hacia abajo antes de la selección).

Puede ser suficiente una GUI que proporcione texto ENORME en el monitor ... pero creo que la función de texto a voz podría ser el problema más difícil.

Si le leen los títulos, una GUI es casi un punto discutible.

XBMC, veo, tiene algunas características de texto a voz ... aunque no puedo determinar si sería algo que requeriría su vista para navegar a través de la interfaz para "llegar" al contenido. (Además, no puedo determinar si el menú en sí es leído por la interfaz gráfica de usuario, lo que permite la navegación "sin vista")

Necesito una GUI para abrir con una lista inmediatamente después del arranque (a través de la cual ella simplemente puede desplazarse y seleccionar contenido).

Mi simple pregunta es si es posible con el IP y si parece que este es un objetivo alcanzable.

En el caso de que alguien pudiera señalarme en la dirección correcta, lo apreciaría infinitamente.

Muchas gracias.


¿Has intentado buscar "discurso" en este foro? Hay algunos enlaces (en realidad no he probado ninguno), por ejemplo, raspberrypi.stackexchange.com/questions/1015/…
Milliways

No estoy seguro si ha publicado esto en los foros de Rapsberry . Si no lo ha hecho, es el tipo de pregunta que se hace allí con bastante frecuencia.
juan

Aunque hay una etiqueta para "reconocimiento de voz", no hubo lo contrario para "generación de voz", que es un tema discreto en sí mismo. Es parte de lo que a menudo se conoce como "texto a voz" (la segunda parte) y todo esto a menudo se asocia con asuntos que generalmente se conocen como "accesibilidad" que se relacionan con hacer las cosas más fáciles de usar para ambos humanos totalmente capaces y también aquellos que tienen algún grado de discapacidad que pueden requerir funcionalidad adicional para lograr los mismos resultados. Esta respuesta se ha utilizado para crear estas tres etiquetas.
SlySven

3
Me encanta la idea de este proyecto, la acabo de nominar para la Mejor idea original de proyecto Raspberry Pi en la competencia de regalos de Navidad en Raspberry Pi Meta.
Phil B.

1
A todos los que han publicado: Estoy muy conmovido y animado por la respuesta a esto. Soy neófito y nunca he visto un PI con mis propios ojos. Estoy muy agradecido por las amables respuestas y he renovado mi determinación de continuar con esto debido a ellas. También compartí las noticias con mi madre, quien dice que prefiere el pastel de manzana a la de frambuesa y, de todos modos, no sabe realmente de qué estoy hablando ... pero eso está bien por ahora :).
LeoFib

Respuestas:


8

No estoy seguro de cómo hacer la interfaz gráfica de usuario, pero sé cómo hacer texto a voz. Puedes usar espeak:

sudo apt-get install espeak
espeak 'Hello world'

Por defecto, la voz de espeak es difícil de entender (para mí). Para encontrar una voz, use:

sudo apt-cache search espeak

Entonces, encuentra una voz. Instalarlo. Entonces corre

man espeak

para encontrar cómo cambiar la voz. Debería ser simple.

Aquí hay un ejemplo de algo que hice usando espeak: https://github.com/Merlin04/robotthingy

Editar: creo que podrías hacer una GUI con Kivy. Utiliza python.


7

Solo tengo una experiencia limitada con XBMC, pero creo firmemente que eso podría ser demasiado complicado para 'el público objetivo' (esta mujer de 90 años).

Sin embargo, creo que este proyecto ciertamente se puede lograr en un RasPi. Como soy un desarrollador web, sugeriría crear una aplicación web simple. No tengo ni idea de si algo como esto existe, pero no puedo imaginar que sea demasiado difícil de desarrollar.

Idea básica:

  1. RasPi con Raspbian.
  2. Webapp ejecutando apache.
  3. Algunos backend (PHP, por ejemplo) indexan los archivos en el disco duro, formatean el nombre en un formato legible y los muestran como una lista.
  4. Use javascript para controlar la entrada del joystick y hacer que los títulos de películas / libros se lean con la API de síntesis de voz HTML5 (ejemplo: http://creative-punch.net/2014/10/intro-html5-speech-synthesis-api / ).
  5. Al seleccionar una película / libro, simplemente abra el archivo en el navegador. (De esta manera, no tendrá que abrir una nueva ventana para que pueda regresar al menú presionando el botón Atrás).

OSMC (kodi) expone algunos api de descanso. Tal vez podría usar eso para construir su propio front-end / gui. Sin embargo, estoy de acuerdo con Rien en que esto suena demasiado complejo para su audiencia. ¿No supongo que un humano podría estar cerca para ayudarlo a comenzar / detener audiolibros para ella?
Havnar

Hola Havnar, No, en realidad. Tiene dos perros en la casa y eso es todo ... Creo que una cosa que no mencioné es que ella tampoco tiene conexión a Internet.
LeoFib

Está bien algunas preguntas. Los mantendré cortos debido a la brevedad. 1) RasPi 2 para esto, ¿correcto? 2) ¿Qué sistema operativo recomendarías para esto? 3) ¿Crees que esto sería factible sin WIFI? --No tiene conexión de red, por desgracia. 4) Apache se utiliza para ejecutar un servidor o es un sistema operativo? 5) ¿Debo comenzar a familiarizarme con Linux y sus comandos para prepararme? He aquí una idea: youtube.com/watch?v=NCVWX4suGE4 ¿Qué te parece? ¿Debo ir con un kit genérico RPI 2? --Muchas gracias y feliz año nuevo.
LeoFib

1
1) el pi2 es mucho más poderoso, esto te beneficiará de cualquier manera. 2) raspbian es el más fácil de usar y el más utilizado, por lo que es fácil encontrar guías y ayuda sobre 3) puede tener wifi sin conexión a Internet, no es necesaria la configuración inalámbrica si usa un control remoto por infrarrojos 4) puede usar muchos servidores web apache son muy utilizados 5) sí, un conjunto de habilidades útiles, ¡no obstante! 5B) puede comenzar con un pi2 con tarjeta sd, cable hdmi, adaptador de corriente y comenzar a jugar con él. Algunas habilidades de desarrollo de aplicaciones pueden ser útiles.
Havnar

1
Supongo que tengo una opinión diferente de Havnar sobre las cosas, así que mis respuestas aquí: 1) No es necesario, 1B también debería ser lo suficientemente poderoso, creo, pero de todos modos 2 es seguro. ) Apache es un software de servidor web, por lo que puede ejecutar sus propios sitios web en un sistema (raspi en este caso). Lo que significa que no necesita una conexión a Internet, ya que la página web se ejecutará en su RasPi. 5) Sí, creo que algunas líneas de comando básicas son útiles para ejecutar raspbian y apache.
Rien Heuver

4

He hecho algunas excavaciones ligeras para usted, ya que la mayoría de las cosas pueden volverse demasiado complejas con bastante rapidez para su público objetivo.

Desde mi experiencia personal, botones y la GUI de (no importa cuán simple en sus dev ojos) puede llegar a ser tan confuso para los ancianos.

No sé qué tan buenas son sus habilidades con el desarrollo (web), o si puede obtener un desarrollador experto motivado para ayudarlo a alcanzar sus objetivos, pero la simplicidad para el usuario final es clave aquí.

Por lo tanto, "The One Button Audiobook Player" podría ser lo que estás buscando. O tal vez una adaptación a él.

extracto a continuación:

It basically consists of:

1 Raspberry Pi
1 ModMyPi enclosure
1 button
2 resistors (330 Ohm, 10 Kilo-Ohm)
1 blue LED
1 (slow) 8GB SD-Card
some wire
a pair of speakers

Se ha utilizado el siguiente software:

Raspbian minimal image (http://www.linuxsystems.it/2012/06/raspbian-wheezy-armhf-raspberry-pi-minimal-image)
mpd (music player daemon)
mpc
mpd-python
pyudev (for USB access)
a self-written python script

Las características son las siguientes:

  • siempre encendido: cuando enciende la frambuesa, se iniciará y comenzará el script de Python con el libro de audio en pausa

  • uso de un botón: el botón detiene y reanuda el audio libro o retrocede una pista cuando presiona el botón durante más de 4 segundos

  • recuerda la posición: siempre recordará la última posición jugada

  • solo un audiolibro: siempre habrá un solo audiolibro en la Frambuesa

  • Implementación fácil de audiolibros: cuando conecta una memoria USB con un nombre / etiqueta especial, Raspberry dejará de reproducirse, montará la memoria USB, eliminará el audiolibro antiguo, copiará el nuevo, reconstruirá la lista de reproducción y, después de desconectar el memoria USB: inicia el nuevo audiolibro en modo de pausa

  • formato múltiple: dado que utiliza mpd, el reproductor admite Ogg Vorbis, FLAC, OggFLAC, MP2, MP3, MP4 / AAC, MOD, Musepack y wave

>>> fuente <<< --- ¡todo el crédito va allí!

enlace github


El uso de un Joystick podría expandir la interfaz de control si se hace con cuidado para presentar una interfaz de usuario simple y consistente para el público objetivo: un comentarista en el sitio vinculado notó que solo recordaba la posición de juego mientras el RPi estaba encendido - eso puede ser algo para revisar, aunque estoy seguro de que cuando hice un experimento con un servidor de música LAN mpdrecordé dónde estaba en una larga lista de reproducción, tal vez haya una opción para ello ...
SlySven

No hay razón para no dejar un pi alimentado, de todos modos es mejor para la tarjeta sd de Pi, no está construido para apagarse.
Havnar

" ... no está hecho para apagarse " . Quizás sea mejor decir, "no tolera que se retire la energía sin apagarse correctamente". - Un UPS para un Pi que tengo tiene la facilidad de arrancar y apagar el Pi en un ciclo de temporizador de entre 2-1000 minutos ENCENDIDO y 2-1000 minutos APAGADO, lo que tendría aplicaciones en fotografía de lapso de tiempo, y allí no hay indicios de que esto sea inherentemente dañino, aunque estoy de acuerdo en que la tarjeta SD podría "desgastarse" un poco más rápido de esas escrituras de archivo de registro adicionales.
SlySven
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.