sexta-feira, 11 de janeiro de 2013

µSpeech: biblioteca de reconhecimento de voz para Arduino

Hoje em dia está cada vez mais próximo a integração das máquinas com o homem, ao ponto de dizermos o que queremos e a máquina entender e executar uma ação. Historicamente, desde a década de 50 começou os estudos sobre reconhecimento de voz, e na década de 60 surgiu o Shoebox da IBM foi a primeira máquina capaz de reconhecer 16 palavras, um grande avanço para a época. Hoje, máquinas com grande poder de processamento, como por exemplo o iPhone rodando o software Siri, que executa funções no telefone e, se bobear, ainda dá dicas de roupas e até mesmo indicar uma pizzaria. Agora, em um microcontrolador com uma certa limitação de processamento, é possível ter a mesma funcionabilidade parecida com o Siri? Por incrível que pareça a resposta é sim! A biblioteca µSpeech é uma biblioteca feita para Arduino, desenvolvida pelo Arjo Chakravarty e apresentada em sua tese de doutorado, que permite o reconhecimento de algumas palavras simples. Na maioria dos algoritmos usados para reconhecimento de voz é utilizado a transformada rápida de Fourier (FFT), mas Arjo Chakravarty simplificou este algoritmo, permitindo a aplicação em um microcontrolador simples. Confira esta biblioteca em http://arjo129.github.com/uSpeech/ e o manual (em PDF) em http://cloud.github.com/downloads/arjo129/uSpeech/%C2%B5Speech.pdf

reconhecimento de voz Shoebox IBM

Se você gostou deste post, não deixe de compartilhar em suas redes sociais, ou ainda deixe uma sugestão ou crítica para deixar o Portal MCU cada vez melhor!

Nenhum comentário:

Postar um comentário