A DeepMind, braço de pesquisa em inteligência artificial do Google, anunciou o Genie 2, modelo que promete revolucionar a criação de ambientes 3D interativos. Capaz de gerar mundos jogáveis em tempo real a partir de uma única imagem ou descrição textual, como “um robô humanoide fofo em uma floresta”, o Genie 2 leva a simulação 3D a novos níveis, tornando a criatividade em games e pesquisa ainda mais acessível.
O Genie 2 é a evolução do modelo original da DeepMind, lançado no início deste ano, e está no mesmo patamar de tecnologias desenvolvidas por empresas como a World Labs e a startup israelense Decart. Segundo a DeepMind, o modelo pode criar cenários ricos e variados, onde os usuários podem interagir com os ambientes usando teclado e mouse para realizar ações como pular e nadar.
Introducing Genie 2: our AI model that can create an endless variety of playable 3D worlds – all from a single image. ️
These types of large-scale foundation world models could enable future agents to be trained and evaluated in an endless number of virtual environments. →… pic.twitter.com/qHCT6jqb1W
— Google DeepMind (@GoogleDeepMind) December 4, 2024
Jogabilidade em tempo real com física e animações avançadas
Treinado com vídeos e simulações, o Genie 2 consegue reproduzir interações realistas entre objetos, iluminação dinâmica, reflexos, física e até o comportamento de NPCs (personagens não jogáveis). Os ambientes criados pelo modelo lembram jogos AAA, o que pode estar relacionado ao treinamento do modelo com gravações de gameplays de títulos populares. No entanto, a DeepMind, como outras empresas de IA, mantém sigilo sobre as fontes exatas de seus dados, alegando razões competitivas.
Essa falta de transparência levanta questões legais. Sendo parte do Google, a DeepMind pode ter usado vídeos do YouTube em seus treinamentos, já que os Termos de Serviço da plataforma dão margem para isso. No entanto, surge a dúvida: o Genie 2 estaria recriando jogos de forma não autorizada? Essa questão pode acabar nos tribunais, assim como inúmeros litigos no campo das ferramenras generativas de imagens e vídeos.
Limitações e o foco como ferramenta criativa
Embora impressionante, o Genie 2 ainda possui limitações. Ele é capaz de gerar mundos consistentes em diferentes perspectivas — como visões isométricas ou em primeira pessoa —, mas as simulações têm curta duração, geralmente entre 10 e 20 segundos, podendo chegar a até um minuto. Além disso, o modelo, assim como outros simuladores de ambientes 3D, ainda enfrenta desafios como artefatos visuais e inconsistências.
Apesar disso, o Genie 2 consegue superar algumas limitações de concorrentes. Por exemplo, ele lembra partes de um cenário que não estão visíveis e as recria com precisão quando entram novamente no campo de visão — algo que modelos como o Oasis, da Decart, ainda lutam para alcançar.
Dado esse cenário, a DeepMind está posicionando o Genie 2 mais como uma ferramenta de pesquisa e prototipagem do que como uma solução para jogos completos. Ele pode ser usado para transformar rascunhos e artes conceituais em ambientes interativos, ajudando criadores a explorar ideias rapidamente. Além disso, o modelo pode gerar cenários variados para testar agentes de IA em situações inéditas.
No entanto, é impossível não relacionar uma ferramenta dessa com algumas projeções que vislumbram um futuro em que a IA estará cada vez mais ligada ao desenvolvimento de jogos. O CEO da NVIDIA, Jensen Huang, já afirmou que jogos criados por IA chegarão em menos de 10 anos.