ChatGPT: inteligência artificial agora entende comandos de voz e imagens; mas apenas na versão mobile

ChatGPT: inteligência artificial agora entende comandos de voz e imagens; mas apenas na versão mobile

Nesta segunda-feira (25) a OpenAI anunciou uma atualização bem significativa para o seu chatbot de inteligência artificial, o ChatGPT. A partir de agora, o serviço de inteligência artificial tem a habilidade de aceitar instruções por meio de imagens e voz. Além disso, o chatbot também interage verbalmente com o usuário.

No entanto, é importante ressaltar que tais novidades estão disponíveis apenas se a utilização for feita por dispositivos móveis. Desde maio que o ChatGPT possui um aplicativo oficial para iOS. E em julho foi lançada a versão para Android.

Leia também
George R. R. Martin se une a escritores para processar a OpenAI pelo uso de seus textos no ChatGPT
ChatGPT pode levar OpenAI à falência já no ano que vem

Quando as novidades chegam para os usuários?

Foi comunicado pela companhia que a atualização será disponibilizada para todos os usuários nas próximas duas semanas, com alguns assinantes começando a receber as novidades já hoje.

A OpenAI também declarou que, após esse intervalo, disponibilizará essas funcionalidades para os desenvolvedores. No entanto, não foi especificado quando essas funcionalidades serão disponibilizadas para os usuários que não possuem assinatura, ou seja, aqueles que ainda usam apenas a versão gratuita do ChatGPT.

Os inéditos métodos de interação com o ChatGPT, além de demonstrar o avanço da inteligência artificial (que foi lançada em novembro de 2022), proporcionarão maior conveniência aos usuários, especialmente a funcionalidade de comandos por imagem. Na última semana, foi anunciado também que o Dall-E 3 foi incorporado ao ChatGPT.

Envie uma imagem e obtenha uma resposta

ChatGPT
ChatGPT agora reconhece imagens e fornece respostas com base nela

Conforme ilustrado pela conta da OpenAI no X/Twitter e por demonstrações em seu website, o ChatGPT será capaz de reconhecer uma fotografia e oferecer assistência ao usuário após examinar o conteúdo visual. Em sua postagem na rede de microblogs, a empresa compartilhou um vídeo da IA orientando um usuário sobre como regular o assento de uma bicicleta.

O ChatGPT solicita uma imagem mais precisa do local de fixação do assento, os equipamentos disponíveis para o usuário e o manual específico da bicicleta. No vídeo, a IA percebe que o assento necessita de uma chave Allen, ou sextavada, e que o utensílio se encontra na caixa. Tudo isso somente analisando a imagem fornecida pelo usuário.

Ou seja, a forma de usar é bem semelhante ao Google Lens. Uma foto de qualquer objeto de interesse pode ser tirada e o ChatGPT se esforçará para interpretar a imagem e responder apropriadamente. A ferramenta de desenho do aplicativo também pode ser utilizada para elucidar qualquer dúvida. Além disso, perguntas podem ser feitas verbalmente ou digitadas para complementar a imagem, ajudando a inteligência artificial a entender melhor todo o contexto.

ChatGPT agora escuta e também fala

A OpenAI também apresentou a funcionalidade de comandos e respostas por voz. No exemplo fornecido, o ChatGPT tem uma voz feminina e, seguindo o comando vocal de uma usuária, narra uma fábula infantil.

Por trás de tudo isso está o eficiente modelo Whisper, da própria OpenAI. É este modelo de IA que executa a maior parte da transformação de voz em texto. A companhia está introduzindo também um novo modelo de transformação de texto em voz capaz de criar “áudio parecido com o humano apenas com texto e alguns segundos de amostra vocal”. Em breve, será possível selecionar a voz do ChatGPT entre cinco alternativas disponíveis.

A funcionalidade de conversação por voz é bastante intuitiva: ao tocar em um botão e verbalizar uma questão, o ChatGPT transforma a fala em texto e a introduz na extensa base de dados da LLM. Então ele obtém uma resposta, retransforma em voz e fala a resposta. É como interagir com Alexa ou Google Assistant, só que com respostas melhores (pelo menos é isso que a OpenAI espera).

Se você é assinante do ChatGPT Plus ou Enterprise, já pode habilitar a funcionalidade de voz (se já estiver disponível para você) através das opções do aplicativo. E como explicado antes, as demais novidades serão liberadas de forma gradual ao longo das próximas duas semanas.

Fonte: The Verge e OpenAI

Sobre o Autor

Cearense. 34 anos. Apaixonado por tecnologia e cultura. Trabalho como redator tech desde 2011. Já passei pelos maiores sites do país, como TechTudo e TudoCelular. E hoje cubro este fantástico mundo da tecnologia aqui para o HARDWARE.
Leia mais
Redes Sociais:

Deixe seu comentário

X