Sistema prototipo actuador por comandos de voz utilizando software libre

Autores/as

  • Jaime Andrango Universidad de las Fuerzas Armadas
  • Estevan Gómez Universidad Tecnológica Equinoccial

DOI:

https://doi.org/10.29019/enfoqueute.v7n2.94

Palabras clave:

reconocimiento de voz, comandos de voz, diferencias espectrales, Python, aplicaciones de software libre

Resumen

El presente sistema prototipo es una aplicación informática que mediante la utilización de técnicas de procesamiento digital de señales, extrae información de la voz del usuario, la cual se utiliza para administrar la activación/desactivación de un actuador periférico del computador personal, cuando el usuario pronuncia las vocales. Se aplica el método de diferencias espectrales. Para el aplicativo se utiliza como actuador aquella información registrada en la dirección de memoria 378H; es decir, el puerto paralelo. La propuesta se ha desarrollado haciendo uso de herramientas de software libre, con la finalidad de dar apertura para que otros investigadores puedan tomar este trabajo como base para otros estudios en fases posteriores y por la versatilidad y dinamismo en las herramientas de la programación de software libre.

Metrics

Descargas

La descarga de datos todavía no está disponible.

Citas

A. Larcher, K.-A. L. (2013). “Phoneticallyconstrained PLDA modeling for text-dependent speaker verification with multiple short utterances”. IEEE Internationall Conference on Acoustics, Speech, and Signal ,Processing (ICASSP).
Audacity. (29 de 04 de 2016). Audacity Español. Obtenido de Audacity Español: http://audacity.es/
Bernal, J. (2000). Reconocimiento de Voz y Fonética Acústica. Madrid: Ra-Ma.
Chen, Y. L.-M. (2015). “Locallyconnected d and convolutional neural networks for smalL footprint speaker recognition,”. Interspeech.
García, C., & Tapia, D. (2000). Estudio de la Frecuencia Fundamental de la Voz y de sus Efectos en el. Proyecto de Fin de Carrera E.T.S.I. Madrid, España: U. Politécnica de Madrid.
Grayson, J. (2000). Phyton and Tkinter Programming‖, . Manning Publications Co.
H. Aronowitz, R. H. (2011). “New developments in voice biometrics for user. n Interspeech, Florence, 17-20.
Hans, P. (2011). A Primer on Scientific Programming with Python. New York: Springer.
Phyton. (29 de 04 de 2016). Idle Phyton. Obtenido de Idle Phyton: https://docs.python.org/2/library/idle.html
Phyton. (29 de 04 de 2016). Python GUI Programming (Tkinter). Obtenido de Python GUI Programming (Tkinter): http://www.tutorialspoint.com/python/python_gui_programming.htm
Poor, H. (1985). An Introduction to Signal Detection and Estimation. New York: Springer- Verlag.
Thomas, T., Pecham, J., & Frangoulis, E. (1989). A Determination of the Sensitivity of Speech Recognisers to Speaker Variability. Proceedings of ICASSP, (págs. 544-547). Glasgow.
Thomas, T., Pecham, J., Frangoulis, E., & Cove, J. (14989). A The Sensitivity of Speech Recognisers to Speaker Variability and Speaker Variation. Proc of Eurospeech, (págs. 408-411). Paris.

Publicado

2016-06-30

Cómo citar

Andrango, J., & Gómez, E. (2016). Sistema prototipo actuador por comandos de voz utilizando software libre. Enfoque UTE, 7(2), pp. 41 - 54. https://doi.org/10.29019/enfoqueute.v7n2.94

Número

Sección

Misceláneos