Sistema prototipo actuador por comandos de voz utilizando software libre
DOI:
https://doi.org/10.29019/enfoqueute.v7n2.94Palabras clave:
reconocimiento de voz, comandos de voz, diferencias espectrales, Python, aplicaciones de software libreResumen
El presente sistema prototipo es una aplicación informática que mediante la utilización de técnicas de procesamiento digital de señales, extrae información de la voz del usuario, la cual se utiliza para administrar la activación/desactivación de un actuador periférico del computador personal, cuando el usuario pronuncia las vocales. Se aplica el método de diferencias espectrales. Para el aplicativo se utiliza como actuador aquella información registrada en la dirección de memoria 378H; es decir, el puerto paralelo. La propuesta se ha desarrollado haciendo uso de herramientas de software libre, con la finalidad de dar apertura para que otros investigadores puedan tomar este trabajo como base para otros estudios en fases posteriores y por la versatilidad y dinamismo en las herramientas de la programación de software libre.
Descargas
Referencias
Audacity. (29 de 04 de 2016). Audacity Español. Obtenido de Audacity Español: http://audacity.es/
Bernal, J. (2000). Reconocimiento de Voz y Fonética Acústica. Madrid: Ra-Ma.
Chen, Y. L.-M. (2015). “Locallyconnected d and convolutional neural networks for smalL footprint speaker recognition,”. Interspeech.
García, C., & Tapia, D. (2000). Estudio de la Frecuencia Fundamental de la Voz y de sus Efectos en el. Proyecto de Fin de Carrera E.T.S.I. Madrid, España: U. Politécnica de Madrid.
Grayson, J. (2000). Phyton and Tkinter Programming‖, . Manning Publications Co.
H. Aronowitz, R. H. (2011). “New developments in voice biometrics for user. n Interspeech, Florence, 17-20.
Hans, P. (2011). A Primer on Scientific Programming with Python. New York: Springer.
Phyton. (29 de 04 de 2016). Idle Phyton. Obtenido de Idle Phyton: https://docs.python.org/2/library/idle.html
Phyton. (29 de 04 de 2016). Python GUI Programming (Tkinter). Obtenido de Python GUI Programming (Tkinter): http://www.tutorialspoint.com/python/python_gui_programming.htm
Poor, H. (1985). An Introduction to Signal Detection and Estimation. New York: Springer- Verlag.
Thomas, T., Pecham, J., & Frangoulis, E. (1989). A Determination of the Sensitivity of Speech Recognisers to Speaker Variability. Proceedings of ICASSP, (págs. 544-547). Glasgow.
Thomas, T., Pecham, J., Frangoulis, E., & Cove, J. (14989). A The Sensitivity of Speech Recognisers to Speaker Variability and Speaker Variation. Proc of Eurospeech, (págs. 408-411). Paris.
Publicado
Número
Sección
Licencia
Los autores retienen todos sus derechos (© copyright).
- Los autores retienen sus derechos de marca y patente, y también sobre cualquier proceso o procedimiento descrito en el artículo.
- Los autores retienen el derecho de compartir, copiar, distribuir, ejecutar y comunicar públicamente el artículo publicado en Enfoque UTE (por ejemplo, colocarlo en un repositorio institucional o publicarlo en un libro), siempre que se dé el reconocimiento de su publicación inicial en la revista Enfoque UTE.
- Los autores retienen el derecho a hacer una posterior publicación de su trabajo, de utilizar el artículo o cualquier parte de aquel (por ejemplo: una compilación de sus trabajos, notas para conferencias, tesis, o para un libro), siempre que indiquen la fuente de publicación (autores del trabajo, revista, volumen, número y fecha).