O Novo Agente de IA do Google DeepMind Aprende, Adapta-se e Joga Jogos como um Humano

Decrypt

Em resumo

  • O sistema usou o modelo Gemini do Google para raciocinar sobre objetivos, explicar os seus planos e agir em jogos desconhecidos.
  • SIMA 2 aprendeu novas habilidades através de jogos autodirigidos e adaptou-se a mundos criados momentos antes pelo Genie 3.
  • A DeepMind planeou uma pré-visualização de pesquisa limitada para desenvolvedores e académicos.

Hub de Arte, Moda e Entretenimento da Decrypt.


Descubra SCENE

A Google DeepMind introduziu o SIMA 2 na quinta-feira—um novo agente de IA que a empresa afirma comportar-se como um “companheiro” dentro de mundos virtuais. Com o lançamento do SIMA 2, a DeepMind visa avançar além de ações simples na tela e mover-se em direção a uma IA que pode planejar, explicar-se e aprender através da experiência.

“Este é um passo significativo na direção da Inteligência Artificial Geral (AGI), com importantes implicações para o futuro da robótica e da incorporação da IA em geral,” disse a empresa em seu site.

A primeira versão do SIMA (Agente Multi-mundo Instruível e Escalável), lançada em março de 2024, aprendeu centenas de habilidades básicas ao observar a tela e usar controles de teclado e mouse virtuais. A nova versão do SIMA, disse o Google, leva as coisas um passo adiante, permitindo que a IA pense por si mesma.

SIMA 2 é o nosso agente de IA mais capaz para mundos 3D virtuais. 👾🌐

Alimentado pela Gemini, vai além de seguir instruções básicas para pensar, entender e tomar ações em ambientes interativos – o que significa que você pode conversar com ele através de texto, voz ou até mesmo imagens. Aqui está como 🧵 pic.twitter.com/DuVWGJXW7W

— Google DeepMind (@GoogleDeepMind) 13 de novembro de 2025


“SIMA 2 é o nosso agente de IA mais capaz para mundos 3D virtuais,” escreveu o Google DeepMind no X. “Impulsionado pelo Gemini, ele vai além de seguir instruções básicas para pensar, entender e tomar ações em ambientes interativos – o que significa que você pode conversar com ele através de texto, voz ou até imagens.”

Ao usar o modelo de IA Gemini, o Google afirmou que o SIMA pode interpretar objetivos de alto nível, discutir os passos que pretende dar e colaborar dentro dos jogos com um nível de raciocínio que o sistema original não conseguia alcançar.

A DeepMind reportou uma generalização mais forte em ambientes virtuais, e que o SIMA 2 completou tarefas mais longas e complexas, que incluíam solicitações lógicas, esboços desenhados na tela e emojis.

“Como resultado dessa habilidade, o desempenho do SIMA 2 está significativamente mais próximo do de um jogador humano em uma ampla gama de tarefas”, escreveu o Google, observando que o SIMA 2 teve uma taxa de conclusão de tarefas de 65%, em comparação com 31% do SIMA 1.

O sistema também interpretou instruções e agiu dentro de mundos 3D totalmente novos gerados pelo Genie 3, outro projeto da DeepMind lançado no ano passado que cria ambientes interativos a partir de uma única imagem ou instrução de texto. O SIMA 2 se orientou, entendeu os objetivos e tomou ações significativas em mundos que nunca havia encontrado até momentos antes do teste.

“O SIMA 2 está agora muito melhor em executar instruções detalhadas, mesmo em mundos que nunca viu antes”, escreveu a Google. “Pode transferir conceitos aprendidos como 'mineração' em um jogo e aplicá-los a 'colheita' em outro—conectando os pontos entre tarefas semelhantes.”

Após aprender com demonstrações humanas, os pesquisadores disseram que o agente mudou para um jogo auto-dirigido, utilizando tentativa e erro e feedback gerado pelo Gemini para criar novos dados de experiência, incluindo um ciclo de treinamento onde o SIMA 2 gerou tarefas, tentou-as e, em seguida, alimentou seus próprios dados de trajetória de volta na próxima versão do modelo.

Enquanto o Google elogiou o SIMA 2 como um avanço para a inteligência artificial, a pesquisa também identificou lacunas que ainda precisam ser abordadas, incluindo dificuldades com tarefas muito longas e de múltiplos passos, trabalho dentro de uma janela de memória limitada e enfrentando desafios de interpretação visual comuns aos sistemas de IA 3D.

Mesmo assim, a DeepMind afirmou que a plataforma serviu como um campo de testes para habilidades que poderiam eventualmente migrar para a robótica e a navegação.

“A nossa pesquisa SIMA 2 oferece um caminho sólido para aplicações em robótica e mais um passo em direção à AGI no mundo real,” disse.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário