Colar inteligente consegue entender comandos de voz inaudíveis

Colar inteligente consegue entender comandos de voz inaudíveis

Dispositivos inteligentes com comando de voz e assistentes digitais precisam de bons microfones para que a voz do usuário possa ser identificada com o máximo de precisão. Porém, pesquisadores da Universidade de Cornell nos Estados Unidos já produziram um colar que consegue identificar esses comandos mesmo que não sejam ditos em voz alta.

O pequeno dispositivo reconhece comandos tanto em inglês quanto em mandarim e não o faz através de microfones e sons e sim pela deformação da pele do pescoço do usuário enquanto ele fala mesmo que seja em voz muito baixa ou inaudível.

Leia também:

Xiaomi lança alto-falante capaz de controlar aparelhos não inteligentes
CES 2022: coleira inteligente pode monitorar os sinais vitais de cachorros

Colar inteligente conta com câmera

O colar foi batizado de SpeeChin e conta com uma câmera infravermelha que possibilita essa função. Dessa forma, ele identifica as palavras que a pessoa está pronunciando mesmo que ela fale muito baixo ou apenas mova os lábios simulando a fala sem emitir nenhum som.

Isso o destaca bastante, já que assistente virtuais como a Alexa, Siri e Google Assistente precisam ouvir a voz do usuário de forma clara e sem interferências para conseguir compreender os comandos.

O professor Cheng Zhang, que é autor principal do projeto que deu vida ao colar inteligente, falou um pouco sobre o objetivo das suas pesquisas.

“Um colar é um objeto com o qual as pessoas estão acostumadas, ao contrário de dispositivos montados na orelha, que podem ser desconfortáveis. Mesmo que as pessoas já tenham aparelhos com reconhecimento de fala no computador ou celular, elas precisam vocalizar o som para eles funcionarem, e isso nem sempre é socialmente apropriado”.

Falando em voz baixa e mantendo a discrição

colar inteligente

O SpeeChin foi projetado para ser um equipamento capaz de aprender diversos padrões de falar de uma pessoa através dos movimentos da pele do seu pescoço, ou seja, sem que ela precise emitir nenhum som. Ele foi impresso em 3D e tem um tamanho pequeno e discreto para ser usado pendurado no pescoço sem chamar muita atenção e nem atrapalhar nas tarefas diárias.

Esse projeto, inclusive, lembra bastante o NeckFace, que surgiu no ano passado. Ela é uma nova tecnologia também desenvolvida por pesquisadores que consegue rastrear as expressões faciais de um usuário para convertê-las em palavras através de uma câmera infravermelha que consegue ter acesso a imagens tanto do rosto quanto do queixo da pessoa.

Chang, inclusive, anunciou a semelhança entre eles, e também as diferenças ao afirmar que o SpeeChin é bem mais discreto já que não precisa ter uma câmera apontada para o rosto da pessoa e tendo acesso a tudo o que acontece atrás dela.

“Ao contrário do NeckFace, o SpeeChin preza pela conveniência e privacidade. Uma câmera montada na frente do seu rosto fotografa também o que está acontecendo atrás de você. Além disso, ninguém vai querer ter uma lente apontada para si mesmo o dia inteiro”.

Testando o SpeeChin em 2 idiomas diferentes

colar inteligente

Com o equipamento em mãos, os pesquisadores já começaram os testes para confirmar sua eficácia. Para isso, eles reuniram 20 voluntários, sendo que 10 deles falam em inglês e 10 falam em mandarim. Esses testes serviram ainda para que eles pudessem medir a posição do queixo de cada participante e, com isso, ajudar a gerar imagens que são usadas para treinar o dispositivo para que ele seja capaz de reconhecer os comandos mais simples.

Nesse teste, os voluntários pronunciaram 54 frases em inglês, que incluíam números, comandos interativos, comandos de assistentes virtuais, pontuação e de navegação. Já no mandariam foram 44 palavras com frases mais simples. O colar inteligente foi capaz de reconhecer os comandos em inglês com uma precisão em torno de 90,5% e os em mandarim com 91,6%.

O professor Cheg Zhang se mostrou muito otimista com os resultados.

“Nossos testes mostraram que o equipamento funciona satisfatoriamente bem mesmo quando o usuário está caminhando e pronunciando palavras impossíveis de serem ouvidas em um ambiente aberto. Estamos introduzindo um hardware totalmente novo neste campo, com a fala audível se tornando um elemento secundário”.

O avanço de uma tecnologia como essa pode fazer diferença na vida de algumas pessoas, principalmente aquelas que tem algum problema na voz e não conseguem falar naturalmente ou até mesmo para situações mais públicas como por exemplo dar comandos de voz ao seu smartphone em meio a uma sala de espera ou fila sem que ninguém escute.

A escolha por um colar ao invés de um fone de ouvido, por exemplo, também foi explicada pelo professor. Segundo ele, um colar é algo com o qual as pessoas já estão acostumadas e que podem ser usados de forma discreta e não incômoda, sem afetar as tarefas diárias como aconteceria com fones de ouvido que acabariam afetando a percepção do som ambiente ao redor.

Fonte: Cornell University

Sobre o Autor

Redes Sociais:

Deixe seu comentário

X