ANÁLISE: RTX Voice, cancelamento de ruído por inteligência artificial

ANÁLISE: RTX Voice, cancelamento de ruído por inteligência artificial

A transição entre arquiteturas de placas de vídeo pode representar um salto abissal de possibilidades, ainda mais quando recursos de IA e aprendizagem profunda são enfatizados. A passagem da NVIDIA da arquitetura Pascal (2016) para a Turing (2018) é um exemplo nítido. Com a Turing, e as placas RTX, além de um novo processo de fabricação – de 16nm para 12nm – e o uso de memórias GDDR6, também fomos apresentados a duas novas tecnologias que são aliadas no futuro que a empresa espera para o mercado de jogos. Essas duas tecnologias são: Núcleos Tensores e Núcleos RT

Ambos são unidades de execução que a NVIDIA implementou nas placas RTX com objetivos distintos. No caso dos núcleos tensores estamos falando de unidades desenhadas para trabalhar com cálculo de matrizes, o que a grosso modo significa uma maior autonomia e capacidade para a operação de tarefas de aprendizado profundo (Deep Learning) e IA (Inteligência Artificial). 

Já no caso do RT Core, este RT que também aparece no nome das placas atuais da NVIDIA, são as unidades de execução que atuam nos cálculos e processamento do tão falado Ray Tracing. Como a trajetória da luz nos games com o Ray Tracing habilitado é um cálculo em constante execução, os RT Core é uma porção de hardware que visa reduzir o impacto que esse recurso gera. 

Com essas duas possibilidades implementadas na arquitetura Turing, a NVIDIA tenta mostrar como o Ray Tracing e a IA pode beneficiar o jogador, não só em performance bruta, mas também em temas satélites que não deixam de ser um uma possibilidade que o gamer pode explorar. Prova disso é a possibilidade mais recente que pode ser explorada com recursos da série RTX (e até GTX, vamos falar um pouco sobre isso mais pra frente), o RTX Voice

A NVIDIA descreve assim o recurso:

Quando você está trabalhando, jogando e criando conteúdo de casa, você quer manter os ruídos de mundo num nível mínimo. O Nvidia RTX Voice é um novo plugin que tira vantagem das GPUs Nvidia RTX e de todas as suas capacidades de inteligência artificial (IA) para remover ruídos de fundo que causem distrações em suas transmissões e chats de voz”.

Sim, estamos falando de uma redução na captação do ruído de fundo via inteligência artificial. Recurso que tira proveito do Núcleo Tensor, que comentamos acima, presente nas RTX. 

O RTX Voice soma-se a outras capacidades que são garantidas graças à arquitetura Turing e suas unidades de execução. 

O mais famoso deles é o filtro antisserilhamento DLSS (Deep Learning Supersampling), que via treinamento, consegue, ao mesmo tempo, reduzir as bordas serrilhadas in game, como também promover um ganho de performance, já que a imagem é renderizada numa resolução menor que a nativa, mas a IA preenche com pixels de forma inteligente para o impacto visual seja mínimo. 

No início, o resultado foi longe do satisfatório mas a tecnologia amadureceu consideravelmente e sua segunda versão (DLSS 2.0), lançada recentemente, com uma nova abordagem na forma do treinamento, tornou o DLSS realmente interessante. 

Além do DLSS e do recém-anunciado RTX Voice, os Núcleos Tensor também foram demonstrados pela NVIDIA, como um vídeo com velocidade padrão sendo transformado em câmera lenta, ou até mesmo o recurso IA InPainting (você pode testá- lo clicando aqui), para que a rede neural da NVIDIA atue preenchendo de forma inteligente elementos que você deseja suprimir de uma imagem. 

Esses e outros recursos fazem parte do que é chamado pela NVIDIA de NGX, conjunto de tecnologias que utiliza a capacidade de deep learning e dos Núcleos Tensores, para maximizar a eficiência da operação.

Neste artigo iremos dar uma olhada em uma dessa tecnologias, o RTX Voice. 

Lançado em este mês, o RTX Voice promete ser útil em diversos sentidos, desde a redução do ruído durante uma gravação de áudio, suprimir o barulho do clique de um teclado mecânico durante sua jogatina com amigos ou numa videochamada ou até mesmo atenuar o barulho do ventilador quando você tiver numa chamada de vídeo com seus colegas de trabalho.

Para utilizar esta tecnologia a NVIDIA estabelece algumas condições

  1. É preciso uma placa de vídeo da série RTX 
  2. Sistema operacional Windows 10
  3. Driver 410.18 ou superior

Está lembrado que comentei acima que o recurso também pode ser utilizado nas GTX? Bom, oficialmente não, mas já está circulando na internet como realizar a instalação do RTX Voice em placas GTX. No fórum do site americano Guru3D foi postado o passo a passo. Lembrando que as GTX não contam com os Núcleos Tensor, o que provavelmente também pode representar um maior consumo de recursos para que o recurso funcione. Testes do WCCFTech mostram que nas RTX o impacto na performance gira em torno de 6% a 11%.

O RTX Voice ainda está em fase beta. Até o momento, a NVIDIA garante a compatibilidade com os seguintes softwares: OBS Studio, Streamlabs, XSplit Broadcaster, Xsplit Gamecaster, Twitch Studio, Discord, Google Chrome, chat do Battle.net, WebEx, Skype, Zoom, Slack e Steam Chat. Em determinados casos problemas estão sendo encontrados, é possível acompanhar essa página da NVIDIA com o feedback das pessoas que estão testando o recurso. 

Para este teste utilizei uma placa de vídeo NVIDIA RTX 2080 Ti. Em relação aos microfones escolhi duas opções. O primeiro é o microfone do headset Dazz Rock Python 7.1 e o outro é o microfone condensador HyperX Quadcast. O uso de um microfone condensador é bem interessante neste caso porque, além de ter uma grande sensibilidade, o que significa uma maior captação sons, incluindo ruídos, e é possível utilizar o padrão polar omnidirecional, o que forçará ainda mais o trabalho do RTX Voice para atenuar ruídos de múltiplas direções.

Siga o Hardware.com.br no Instagram e acompanhe o melhor da tecnologia.

Bom, para começar é preciso baixar o software do RTX Voice. O link é este aqui. A versão disponível é a 0.5.12.6. O instalador tem 327 MB, após a instalação passa para 689 MB. 

A interface do software é bem objetiva: duas caixas de seleção. A primeira simboliza que o ruído da sua fonte de entrada será suprimido, enquanto na segunda é o dispositivo de saída, para que durante uma chamada de vídeo, por exemplo, o ruído proveniente de chamada do seu amigo seja mitigado quando chegar para você. Há também um controle deslizante para que o nível da supressão do ruído seja escolhido. Vai de 0% a 100%.

As gravações foram feitas numa sala sem qualquer tipo de isolamento acústico. Primeiramente apenas fizemos uma captação do próprio ruído ambiente, e com um ventilador ligado na sala, com e sem o RTX Voice habilitado. Escolhemos o padrão polar omnidirecional, para que o microfone capte o som de todas as direções. Em relação ao ganho, ajustável na parte inferior do microfone, deixamos no último nível. A gravação foi feita com o o software Adobe Audition. Deixamos no nível máximo a supressão de ruído no software do RTX Voice.

Teste 01.1: microfone HyperX Quadcast com o RTX Voice desligado

Teste 01.2: microfone HyperX Quadcast com o RTX Voice ligado

Passamos agora para uma gravação de voz. Dessa vez, além do HyperX Quadcast também fizemos uma gravação com o microfone do headset Logitech G231 Prodigy. Além do barulho do ventilador, agora o RTX Voice terá mais um elemento para compreender e tentar suprimir da gravação: o som das teclas do teclado mecânico Duck Channel One. Este modelo utiliza o switch azul, o mais barulhento entre todos da Cherry.

Teste 02.1: microfone HyperX Quadcast com o RTX Voice desabilitado

Teste 02.2: microfone HyperX Quadcast com o RTX Voice habilitado

Teste 02.3: microfone do headset Dazz Rocky Python  7.1 com o RTX Voice desabilitado

Teste 02.3: microfone do headset Dazz Rock Python 7.1 com o RTX Voice habilitado

Como você pôde observar, o RTX Voice realmente entrega aquilo que promete, a supressão dos ruidos externos, mesmo numa captação com microfone condensador com o padrão polar omnidirecional habilitado é realmente impressionante. Evidentemente que essa tecnologia não substitui um ambiente de gravação controlado, com isolamento acústico, mas chama atenção pela facilidade de sua aplicação e resultado.

Em alguma das minhas captações notei uma variação de volume que também pode ser percebida no vídeo do canal ShortCircuit. Quando há muitos elementos de fundo produzindo ruído, e o RTX Voice trabalha para atenuar, pode acontecer algumas variações na captação, já que a IA está analisando o que deve ou não considerar na hora de suprimir.

Como o recurso está em beta, podemos esperar melhorias até sua versão final. A NVIDIA garante que todo o processamento acontece de forma local, isto é, seus dados de voz não são enviados para algum servidor externo. Ponto para a privacidade.

Sobre o Autor

Editor-chefe no Hardware.com.br, aficionado por tecnologias que realmente funcionam. Segue lá no Insta: @plazawilliam Elogios, críticas e sugestões de pauta: william@hardware.com.br
Leia mais
Redes Sociais:

Deixe seu comentário

X