A Google lança o Gemini Robotics ER 1.6: modelo de robótica SOTA, especialista em raciocínio visual e espacial

ChainNewsAbmedia

A Google DeepMind publicou um modelo de base totalmente novo para robôs, o Gemini Robotics ER 1.6, em que o ER significa Embodied Reasoning (raciocínio incorporado). Este modelo alcança o atual melhor nível (SOTA) em raciocínio visual e espacial e já foi disponibilizado através da Gemini API. Logan Kilpatrick, responsável pelas relações com programadores de IA na Google, divulgou esta notícia nas redes sociais. (Fonte)

O que é o Embodied Reasoning?

Embodied Reasoning refere-se à capacidade dos modelos de IA compreenderem e raciocinarem sobre o mundo físico. Ao contrário dos modelos de linguagem tradicionais, os modelos de raciocínio incorporado precisam de lidar com a posição dos objetos no espaço tridimensional, bem como com a sua forma, materiais e relações de interação física. O Gemini Robotics ER 1.6 foi otimizado especificamente para este tipo de tarefas, permitindo que os robôs compreendam com mais precisão o ambiente envolvente e tomem decisões adequadas sobre as ações a executar.

Capacidades principais

As principais vantagens do Gemini Robotics ER 1.6 concentram-se em duas vertentes:

Capacidade Descrição Raciocínio visual Capacidade de identificar objetos a partir de imagens e vídeos, compreender a estrutura do cenário e, com base nisso, tomar decisões Raciocínio espacial Compreender a posição relativa, a distância e a direção dos objetos no espaço tridimensional, apoiando a planificação de operações complexas

A combinação destas duas capacidades permite que os robôs lidem com tarefas do mundo real mais complexas. Por exemplo, num ambiente de armazém, o robô precisa de identificar simultaneamente objetos de diferentes formas e calcular o melhor ângulo de pega e a posição de colocação — exatamente o tipo de cenário em que o Gemini Robotics ER 1.6 é particularmente competente.

Utilização através da Gemini API

Ao contrário de muitos modelos de robôs do passado que ficaram apenas na fase de artigo, o Gemini Robotics ER 1.6 já disponibiliza acesso através da Gemini API. Isto significa que os programadores e os fabricantes de hardware podem integrar diretamente este modelo nos seus próprios sistemas de robôs, sem necessidade de treinar o modelo do zero.

A disponibilização da API também reduz o limiar para o desenvolvimento de IA para robôs. No passado, desenvolver um sistema de robôs com capacidades de raciocínio visual e espacial exigia uma recolha massiva de dados e trabalho de treino de modelos. Agora, os programadores podem concentrar-se no desenvolvimento do design do hardware e dos casos de uso, deixando as capacidades de raciocínio de base a cargo do Gemini Robotics ER 1.6.

O posicionamento da Google em IA para robôs

O Gemini Robotics ER 1.6 é o mais recente resultado da Google DeepMind na área da robótica. Do RT-2, numa fase inicial, até à série Gemini Robotics de hoje, a Google tem continuado a expandir as capacidades dos grandes modelos de linguagem para a interação com o mundo físico. A versão ER 1.6 melhora ainda mais a exatidão do raciocínio face aos antecessores, destacando-se particularmente em cenários que exigem manipulações mais precisas.

À medida que a indústria de robôs entra numa nova fase de crescimento, os modelos de base com fortes capacidades de raciocínio visual e espacial tornar-se-ão infraestrutura-chave. Para saber mais sobre a evolução do ecossistema Gemini, pode consultar o guia completo do Gemini.

Este artigo Google lançou o Gemini Robotics ER 1.6: modelo de robôs SOTA, especializado em raciocínio visual e espacial foi publicado pela primeira vez em Cadeia de Notícias ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Naver lança beta do AI Tab à medida que o Google Gemini entra no mercado de buscas da Coreia do Sul

Mensagem do Gate News, 24 de abril — A Naver anunciou o início de um beta fechado para o AI Tab, seu novo recurso de busca conversacional, após o lançamento do Gemini pela Google no Chrome na Coreia do Sul. O AI Tab aparecerá ao lado das abas de busca existentes da Naver, oferecendo aos usuários um espaço dedicado para consultas conversacionais

GateNews11m atrás

Contratação de Engenharia de IA na Índia dispara 59,5%, se expande além dos hubs de tecnologia

Relatório do Mercado de Trabalho de IA da LinkedIn 2026, divulgado em 24 de abril, descobriu que as contratações de engenharia de IA na Índia aumentaram 59,5% ano contra ano, marcando o ritmo mais rápido entre os mercados estudados pela plataforma. O crescimento foi impulsionado pela demanda se expandindo além dos centros tecnológicos estabelecidos. Cidades incluindo

CryptoFrontier31m atrás

Banco Commonwealth Reduz 120 Empregos Com a Expansão da IA

O Commonwealth Bank of Australia anunciou que vai cortar aproximadamente 120 empregos enquanto o maior banco do país revisa funções e amplia o uso de inteligência artificial, de acordo com a Bloomberg. Os cortes incluem 43 funções no Bankwest, na Austrália Ocidental, com seis cargos afetados pela automação. Isto é

CryptoFrontier40m atrás

A Cursor revela as razões do treinamento de XAI: o poder de computação ficou travado, e a SpaceX, por sua vez, detém opções de compra no valor de 60 bilhões de dólares

A Anysphere anunciou que o Cursor irá, com a xAI, usar a infraestrutura Colossus para treinar novos modelos e superar a limitação de capacidade de computação; a SpaceX propôs uma opção de aquisição de US$ 60 bilhões (aquisição total dentro de 2026), e, caso não dê certo, pagará aproximadamente US$ 10 bilhões como compensação de colaboração. As duas transações ocorrem ao mesmo tempo, remodelando quem pode treinar o Cursor e quem pode comprar o Cursor; o Cursor ainda permite muitos backends de modelos, mas, a longo prazo, o caminho depende de a SpaceX exercer o direito de aquisição.

ChainNewsAbmedia58m atrás

Avaliação no mercado secundário da Anthropic ultrapassa 1 trilhão de dólares: Forge Global supera a OpenAI em 880 bilhões

De acordo com a reportagem da Decrypt, a avaliação secundária da Anthropic da Forge Global é de cerca de 1 trilhão de dólares; a da OpenAI é de aproximadamente 8.800 bilhões de dólares, com uma reversão de liderança pela primeira vez no mercado secundário. O ARR da Anthropic passou de cerca de 9,0 bilhões no fim de 2025 para aproximadamente 30 bilhões em março de 2026; em três meses, cresceu 233%, elevando a avaliação privada. As avaliações no mercado secundário são diferentes dos financiamentos na rodada primária, refletindo a confiança na saída; no futuro, ainda se espera que quatro frentes — tecnologia, políticas, negócios e narrativa — continuem em foco.

ChainNewsAbmedia59m atrás

Meta Platforms Planeja Redução de 10% da Força de Trabalho em 20 de Maio, Afetando Aproximadamente 8.000 Posições

Mensagem do Gate News, 24 de abril — A Meta Platforms planeja reduzir sua força de trabalho em aproximadamente 10%, afetando cerca de 8.000 vagas, em 20 de maio. Os desligamentos têm a intenção de melhorar a eficiência operacional enquanto aumentam os investimentos em inteligência artificial. A reorganização planejada reflete a

GateNews1h atrás
Comentário
0/400
Sem comentários