Durante o evento Google I/O 2024, ocorrido nesta terça-feira (14), a Gigante das Buscas apresentou novidades para o chatbot Gemini 1.5 Pro, que agora está acessível para os assinantes do plano AI Premium no Google One.
A capacidade dessa nova versão do Gemini de lidar com uma incrível janela de contexto de 2 milhões de tokens é algo que transcende as expectativas até dos usuários mais exigentes. Além disso, a companhia também apresentou uma nova versão do Gemini. Te explico tudo nos próximos parágrafos.
Leia também
Google I/O: Projeto Astra é a inteligência artificial que entende o ambiente através das câmeras dos celulares
Veo é a inteligência artificial do Google para criação de vídeos e que chega para competir com a Sora da OpenAI
Gemini 1.5 Pro: Intuitivo e Repleto de Recursos
Desde o ano passado, o foco da empresa em IA tem recebido merecida atenção, com avanços significativos sendo incorporados no Gemini 1.5 Pro. Este modelo é capaz de entender e processar até um milhão de tokens, proporcionando aos usuários capacidades avançadas para analisar documentos detalhadamente, interpretar imagens, e muito mais.
Já em fevereiro, o Google iniciou a fase de teste desse modelo com desenvolvedores, permitindo-lhes explorar seu vasto potencial. E no dia 13 de março, a empresa deu um passo adiante, abrindo sua tecnologia para um público mais amplo. Os assinantes do pacote Gemini Advanced, integrado ao plano AI Premium do Google One, têm agora a oportunidade de desfrutar de todos esses recursos avançados pelo valor de R$ 97 ao mês.
A versão Pro do Gemini 1.5 oferece uma experiência de IA ainda mais rica e completa. No lançamento deste modelo, o Google ressaltou sua impressionante capacidade de análise: é possível examinar uma hora de vídeo, escutar e interpretar onze horas de áudio, revisar 30 mil linhas de código ou mergulhar em mais de 700 mil palavras. Além disso, houve uma integração cuidadosa deste serviço com os aplicativos do Workspace, o que representa uma vantagem considerável para a produtividade empresarial.
“A muito breve prazo, o Gemini Advanced vai assumir o papel de um analista de dados versátil, descobrindo informações valiosas e gerando gráficos elucidativos de maneira autônoma a partir dos dados contidos em planilhas”, compartilhou Sissie Hsiao, vice-presidente e gerente-geral do Gemini Experiences e do Google Assistente. “Além disso, é importante frisar que o Gemini preserva a privacidade dos seus arquivos, que não são utilizados para treinar nossos modelos de aprendizado de máquina.”
De acordo com as informações divulgadas por Sissie, esse recurso estará disponível no Gemini Advanced “em mais de 150 países e poderá ser utilizado em mais de 35 idiomas diferentes”, ampliando drasticamente o alcance e a utilidade desta ferramenta avançada.
Expansão para 2 milhões de tokens e introdução do 1.5 Flash
O Gemini 1.5 Pro tem tudo para elevar ainda mais o nível. Durante as sessões do Google I/O 2024, foi anunciado que uma próxima atualização permitirá ao chatbot trabalhar com uma janela de contexto expandida para 2 milhões de tokens. No momento, essa funcionalidade está sendo testada e é exclusiva para desenvolvedores através da API, bem como para aqueles cadastrados na lista de espera do Google Cloud.
Demis Hassapis, CEO da divisão Google DeepMind, expressou seu entusiasmo com as melhorias incrementais: “Adicionamos à já robusta estrutura do Gemini não só um aumento na janela de contexto para surpreendentes 2 milhões de tokens, como também efetuamos melhorias significativas na geração de código, no aprimoramento das habilidades de raciocínio lógico e planejamento, além de permitir diálogos mais intricados e um entendimento ainda mais profundo de inputs de áudio e imagem”.
Para aqueles em busca de alternativas mais leves e igualmente eficazes, o Google apresenta o 1.5 Flash. Desenvolvido para ser veloz e eficiente, o 1.5 Flash é a solução ideal para tarefas que demandam agilidade e precisam ser executadas em larga escala.
Apesar de ser uma opção mais compacta em comparação ao 1.5 Pro, o 1.5 Flash não deixa a desejar na sua capacidade de compreender múltiplas informações simultaneamente, explicou Hassabis. Ele é particularmente eficaz para realizar resumos concisos, suportar conversações interativas, descrever conteúdos de imagens e vídeos, extrair dados de documentos extensos e tabelas complexas, entre outras aplicações.
Deixe seu comentário