Google DeepMind lança Genie 2, IA que transforma textos em jogos 3D
A equipe da Google DeepMind revelou o Genie 2, a segunda versão do seu modelo fundamental de inteligência artificial capaz de gerar novos ambientes digitais interativos ou mundos de jogos em tempo real.
O modelo original, lançado em fevereiro, permitia a criação de mundos virtuais em 2D a partir de imagens sintetizadas. Já o Genie 2 avança para a geração de ambientes em 3D, baseados em comandos de texto.
Com o Genie 2, o usuário pode descrever o mundo desejado, escolher a renderização apropriada e entrar no novo ambiente virtual. Em cada etapa, a pessoa ou agente realiza uma ação (como movimentos do mouse ou pressionamento de teclas no teclado), e o Genie 2 simula suas consequências.
Segundo a Google DeepMind, o Genie 2 é capaz de criar mundos interativos e consistentes que duram cerca de um minuto, embora a maioria dos exemplos demonstrados (veja o vídeo abaixo) tenha entre 10 e 20 segundos de duração.
Em comparação com a primeira versão, o Genie 2:
- Memória Expandida: Pode lembrar de elementos do mundo que não estão no campo de visão.
- Perspectivas Variadas: Cria ambientes com diferentes perspectivas, como primeira ou terceira pessoa e câmera isométrica.
- Complexidade 3D: Desenvolve cenas tridimensionais complexas.
- Interações Realistas: Simula diversas interações com objetos, como estourar balões, abrir portas ou explodir barris com tiros.
- Animação de Personagens: Aprendeu a animar personagens de diferentes tipos.
- Modelagem de NPCs: Modela NPCs e interações com eles.
- Efeitos Ambientais: Simula efeitos de água, fumaça, gravidade, iluminação e reflexos.
- Ambientes Baseados em Fotos: Cria ambientes interativos baseados em fotografias reais.
De acordo com a Google DeepMind, o Genie 2 demonstra o potencial dos modelos de mundo fundamentais para criar ambientes tridimensionais diversificados e acelerar o treinamento e teste de agentes de IA, como o SIMA.
A empresa esclarece que a pesquisa ainda está em estágio inicial e requer melhorias significativas nas áreas de capacidades dos agentes e geração de ambientes. Contudo, já vê o Genie 2 como uma solução para o problema estrutural do treinamento seguro de agentes de IA.