Realidade dos Agentes de IA do Vale do Silício: desperdício massivo de tokens, integração de sistemas “extremamente caótica”; a previsão de Huang Renxun sobre o “próximo ChatGPT” ainda precisa ser verificada

De acordo com uma reportagem em profundidade da CNBC, em duas reuniões fechadas na Califórnia nesta semana, vários CEOs de startups de IA e engenheiros declararam, de forma direta, que a atual implantação em escala de agentes de IA enfrenta dois grandes problemas estruturais: “desperdício massivo de tokens” e “extrema confusão entre sistemas”. O registro feito no local contrasta fortemente com a perspectiva otimista do CEO da Nvidia, Jensen Huang, em março, ao dizer que agentes de IA seriam “o próximo ChatGPT”, sugerindo que o gargalo real dessa área não está no poder computacional, e sim no desenho das decisões, na eficiência de tokens e na integração entre múltiplos sistemas.

O maior problema é jogar tudo nas mãos do LLM.

O CEO da startup de IA Meibel, Kevin McGrath, apontou na reunião: “O maior problema que estamos enfrentando agora é achar que tudo precisa ser processado por grandes modelos de linguagem — jogar todos os tokens e todo o dinheiro em um bot de IA, e ele vai queimar milhões de tokens.” Ele enfatizou que, ao projetar os fluxos de trabalho de um agente, as empresas precisam avaliar com mais clareza quais tarefas realmente exigem LLM, e quais podem ser feitas com lógica mais barata baseada em regras ou com aprendizado de máquina tradicional.

Essa observação ecoa a reação do mercado após a versão empresarial da Anthropic Claude mudar para cobrança por uso — quando o consumo de tokens se transforma diretamente em custo, o modelo de desenvolvimento de “jogar tudo de forma cega em um agente” mostra rapidamente a pressão financeira. A visão da Meibel representa um grupo de profissionais de engenharia menos entusiasmados com hype: a “arte” de uma arquitetura de agentes está em impor limites, e não em deixar solto.

Sistemas de coordenação com múltiplos agentes geram confusão mútua

Outra palavra-chave recorrente na reportagem da CNBC é “caótica”. Quando uma empresa roda vários agentes de IA ao mesmo tempo — por exemplo, um para lidar com atendimento ao cliente, um para agendar, e um para lidar com as finanças — a transmissão de mensagens entre os agentes, a consistência de estado, as respostas a erros e quaisquer outras interações acabam se afetando. Qualquer comportamento fora do normal de um agente pode se espalhar em efeito dominó. Karpathy também mencionou nesta semana que ele próprio roda um fluxo de trabalho com simultaneamente 10–20 agentes, mas admitiu que a revisão de código e o processo de PR viraram o novo gargalo.

A confusão desses sistemas com múltiplos agentes, em essência, é a repetição dos velhos problemas dos sistemas distribuídos na era dos LLMs: não há SLA claro, não há fronteiras transacionais e não há semântica de tentativas de falha e novas tentativas. Embora a Anthropic e a OpenAI tenham lançado camadas de protocolo como MCP e Agent SDK, na prática de adoção pelas empresas, a padronização ainda está muito atrás do crescimento do número de agentes.

A polêmica sobre salário em tokens de 250 mil dólares esfria

Em março, o CEO da Nvidia, Jensen Huang, divulgou fortemente o conceito de “salário em tokens” em sua fala no GTC e em entrevistas subsequentes, afirmando: “Se um engenheiro com salário anual de 500 mil dólares não consumir pelo menos 250 mil dólares em tokens, eu ficarei profundamente preocupado.” A lógica dele é: o engenheiro deve substituir suas próprias ações de baixo nível por agentes de IA, e a quantidade absoluta de tokens consumidos é o indicador substituto de produtividade. Essa argumentação pode ser conferida na entrevista mais recente do Jensen Huang (parte 1), na qual ele explica de forma completa a demanda por computação para IA.

Mas as opiniões observadas no local na reportagem da CNBC mostram que o grupo de engenheiros na Califórnia está cada vez mais cauteloso com esse discurso: a quantidade de tokens consumidos não equivale a produtividade e, inclusive, pode ser um sinal de que o design do agente é ruim. O valor real dos engenheiros ainda está em “decidir quais tarefas vale a pena chamar um agente, como decompor as tarefas e como desenhar o tratamento de erros” — e esses trabalhos em si não podem ser medidos pela quantidade de tokens consumida.

Crypto e agentes de IA ainda precisam de tempo

Para a indústria de crypto, nesta semana as tendências de IA que “devoram” 80% do venture capital global e a integração ativa de projetos DeFi com agentes autônomos foram construídas sobre o pressuposto de que “a tecnologia de agentes já atingiu um nível de implantação”. Mas a reportagem da CNBC lembra: mesmo em ambientes empresariais puramente web2, a eficiência de tokens dos agentes e a integração entre múltiplos sistemas ainda não estão estáveis. Colocar agentes em um ambiente on-chain 24 horas por dia, 7 dias por semana, no qual ativos podem ser roubados em tempo real, amplifica tanto os riscos técnicos quanto os riscos financeiros. O verdadeiro ponto de partida da relação Crypto × IA pode ainda ter de esperar até a maturidade da padronização no nível de frameworks de agentes (como MCP, LangGraph, Cloudflare Agents).

Este artigo “Realidade dos Agentes de IA na Califórnia: desperdício massivo de Tokens, integração de sistemas ‘extremamente caótica’, previsão de Jensen Huang do ‘próximo ChatGPT’ ainda precisa ser verificada” apareceu pela primeira vez em 鏈新聞 ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

OristaPay Lança Sistema de Pagamentos com IA no Telegram, Habilita Liquidações Instantâneas de USDT na TON

Mensagem da Gate News, 24 de abril — OristaPay, uma marca operada sob a RD Technologies, anunciou um caminho completo de pagamentos que permite que agentes de IA executem transações dentro do ecossistema do Telegram durante o Hong Kong Web3 Festival. O sistema permite que os usuários iniciem transações de ativos digitais por meio de interações em linguagem natural sem sair da interface de bate-papo através de na

GateNews57m atrás

O Projeto Prometheus de Jeff Bezos eleva $10B em $38B de avaliação

Mensagem do Gate News, 24 de abril — O Projeto Prometheus, um laboratório de IA fundado pelo fundador da Amazon Jeff Bezos e pelo ex-executivo do Google Vik Bajaj, encerrou uma rodada de financiamento de $10 bilhões em uma avaliação de $38 bilhões. JPMorgan Chase e BlackRock são

GateNews5h atrás

OpenAI Lança GPT-5.5, Projetado para Tarefas de Agentes e Fluxos de Trabalho Complexos

Mensagem do Gate News, 24 de abril — A OpenAI lançou oficialmente o GPT-5.5, um modelo de IA de próxima geração projetado para lidar com objetivos complexos, integração de ferramentas, auto-verificação e conclusão de tarefas em várias etapas. O modelo se destaca na escrita de código e depuração, pesquisa online, análise de dados, criação de documentos

GateNews6h atrás

Startup de Agentes de IA Band Levanta Rodada Seed de $17M Liderada por Sierra Ventures, Hetz Ventures, Team8

Mensagem de Gate News, 24 de abril — A Band, uma startup que está construindo uma plataforma de comunicação e colaboração para agentes de IA, fechou uma rodada seed de $17 milhões liderada pela Sierra Ventures, Hetz Ventures e Team8. Fundada em meados de 2025 pelo CEO Arick Goomanovsky e pelo CTO Vlad Luzin, a empresa desenvolve software para re

GateNews6h atrás

Brecha de Segurança da Vercel se Expande para Centenas de Usuários; Desenvolvedores de IA em Maior Risco

Mensagem do Gate News, 23 de abril — A Vercel revelou em 19 de abril que seu incidente de segurança, inicialmente descrito como afetando um "subconjunto limitado de clientes", se expandiu para uma comunidade de desenvolvedores muito mais ampla, especialmente aqueles que estão construindo fluxos de trabalho de agentes de IA. O ataque pode afetar centenas de usuários

GateNews11h atrás

OpenAI lança GPT-5.5: contexto de 12M, índice AA em primeiro lugar, Terminal-Bench 82,7% reescreve o benchmark de agentes

A OpenAI anunciou o GPT-5.5, com foco em trabalho orientado por agentes e processamento de conhecimento empresarial, e também lançou em sincronia no ChatGPT e no Codex. Os principais pontos incluem uma janela de contexto de 1200 milhões de tokens, AA Intelligence Index 60, superando o Claude Opus em 4,7 e o Gemini 3,1 Pro; os preços são de 5 dólares por 1 milhão de tokens de entrada e 30 dólares por 1 milhão de tokens de saída, com redução de tokens de saída de aproximadamente 40%, e custo real aumentando aproximadamente 20%.

ChainNewsAbmedia12h atrás
Comentário
0/400
Sem comentários