OpenClaw Token Guia definitiva de poupança: com o modelo mais potente, gastando o mínimo de dinheiro / com dicas incluídas

PANews

作者:xiyu

Quer usar Claude Opus 4.6 mas não quer que a fatura do final do mês exploda? Este artigo ajuda a cortar entre 60-85% dos custos.

I. Onde gasta os tokens?

Achava que tokens eram apenas “o que você diz + a resposta da IA”? Na realidade, muito mais.

Custos ocultos de cada conversa:

  • Prompt do Sistema (~3000-5000 tokens): comandos principais do OpenClaw, não dá para alterar
  • Injeção de ficheiros de contexto (~3000-14000 tokens): AGENTS.md, SOUL.md, MEMORY.md, etc., enviados a cada interação — este é o maior custo invisível
  • Mensagens históricas: quanto mais conversa, mais longo fica
  • Sua entrada + resposta da IA: isso é o que você acha que é “tudo”

Um simples “Como está o tempo hoje” consome na prática entre 8000-15000 tokens de entrada. Usando Opus, só o contexto custa entre $0.12-0.22.

Cron ainda mais agressivo: cada disparo = nova conversa = reinjetar todo o contexto. Um cron que roda a cada 15 minutos, 96 vezes por dia, com Opus, sai entre $10-20 por dia.

Heartbeat funciona do mesmo jeito: é uma chamada de diálogo, quanto mais curto o intervalo, mais caro.

II. Camadas do modelo: Sonnet diário, Opus para tarefas críticas

A maior economia, com maior impacto. Sonnet custa cerca de 1/5 de Opus, e cobre 80% das tarefas diárias.

Prompt:

Por favor, configure o modelo padrão do OpenClaw para Sonnet,

use Opus apenas para análises profundas ou criação de conteúdo.

Especificamente:

1) Modelo padrão como Sonnet

2) Tarefas cron padrão usando Sonnet

3) Apenas tarefas de escrita, análises complexas, especifique Opus

**Cenários Opus:** textos longos, códigos complexos, raciocínio em múltiplas etapas, tarefas criativas

**Cenários Sonnet:** conversas cotidianas, perguntas simples, verificações cron, heartbeat, manipulação de ficheiros, traduções

**Teste: após a troca, custo mensal cai 65%, experiência quase igual.**

III. Reduzir o contexto: cortar os maiores consumidores invisíveis de tokens

Cada chamada tem um “ruído de fundo” de 3000-14000 tokens. Otimizar a injeção de ficheiros é a melhor relação custo-benefício.

Prompt:

Ajude a simplificar os ficheiros de contexto do OpenClaw para economizar tokens.

Especificamente:

1) Remova partes desnecessárias do AGENTS.md (regras de grupo, TTS, funções não usadas), comprima para menos de 800 tokens

2) Resuma o SOUL.md em pontos essenciais, entre 300-500 tokens

3) Limpe informações expiradas do MEMORY.md, mantendo até 2000 tokens

4) Verifique a configuração workspaceFiles, remova ficheiros de injeção desnecessários

Regra prática: a cada 1000 tokens removidos na injeção, estima-se uma economia de cerca de $45 por mês, considerando 100 chamadas diárias ao Opus.

IV. Otimização do Cron: o assassino oculto de custos

Prompt:

Ajude a otimizar as tarefas cron do OpenClaw para economizar tokens.

Por favor:

1) Liste todas as tarefas cron, suas frequências e modelos usados

2) Reduza tarefas não criativas para Sonnet

3) Combine tarefas que rodam no mesmo período (por exemplo, várias verificações em uma só)

4) Diminua a frequência de tarefas desnecessárias (por exemplo, de 10 para 30 minutos para verificações do sistema, de 3 para 1 por dia para verificações de versão)

5) Configure delivery para notificações sob demanda, sem enviar mensagens desnecessárias

Princípio central: mais frequente nem sempre é melhor. A maioria das necessidades "em tempo real" é falsa. Agrupar 5 verificações independentes em uma única chamada economiza cerca de 75% do custo de injeção de contexto.

V. Otimização do Heartbeat

Prompt:

Ajude a otimizar a configuração do Heartbeat do OpenClaw:

1) Intervalo de trabalho entre 45-60 minutos

2) Período de silêncio das 23:00 às 08:00

3) Simplifique o HEARTBEAT.md ao mínimo possível

4) Agrupe verificações dispersas em execuções em lote no heartbeat

VI. Busca precisa: economize 90% de tokens de entrada com qmd

Ao consultar fontes, o agente normalmente lê “todo o texto” — um ficheiro de 500 linhas pode ter 3000-5000 tokens, mas só precisa de 10 linhas. 90% dos tokens de entrada são desperdiçados.

qmd é uma ferramenta de busca semântica local, que cria um índice de texto completo + vetores, permitindo ao agente localizar precisamente os parágrafos necessários, sem ler tudo. Tudo local, sem custos de API.

Usando com mq (Mini Query): pré-visualizar estrutura, extrair parágrafos específicos, buscar palavras-chave — cada consulta lê apenas 10-30 linhas.

Prompt:

Configure o qmd para buscar conhecimento e economizar tokens.

Endereço no Github: https://github.com/tobi/qmd

Requisitos:

1) Instale o qmd

2) Crie o índice do diretório de trabalho

3) Adicione regras de busca no AGENTS.md, forçando o agente a usar qmd/mq antes de ler tudo

4) Configure atualizações periódicas do índice

Resultado esperado: reduzir de 15000 para 1500 tokens por consulta, uma economia de 90%.

Diferença do memorySearch: o memorySearch "recupera" (MEMORY.md), o qmd "consulta" (base de conhecimento personalizada), sem interferir um no outro.

VII. Escolha entre Memory Search local ou Voyage AI

Prompt:

Configure o memorySearch do OpenClaw.

Se meus ficheiros de memória são poucos (algumas dezenas de md),

recomenda usar embedding local ou Voyage AI?

Explique custos e diferenças na qualidade de busca.

**Conclusão simples:** com poucos ficheiros, embeddings locais (zero custo); com muitos ficheiros ou necessidade de múltilíngue, Voyage AI (2 bilhões de tokens gratuitos por conta).

VIII. Lista final de configurações

Prompt:

Ajude-me a otimizar toda a configuração do OpenClaw de uma só vez para maximizar a economia de tokens, seguindo este checklist:

- Modelo padrão: Sonnet, apenas usar Opus para tarefas de criação/análise

- Simplificar AGENTS.md, SOUL.md, MEMORY.md

- Reduzir todas as tarefas cron para Sonnet + combinar + diminuir frequência

- Intervalo do Heartbeat para 45 minutos + silêncio noturno

- Configurar qmd para busca precisa, substituindo leitura completa

- Manter apenas ficheiros essenciais em workspaceFiles

- Limpar periodicamente MEMORY.md, mantendo até 2000 tokens

Benefício de uma configuração única:

1. Camadas do modelo — Sonnet para rotina, Opus para tarefas críticas, economizando 60-80%

2. Contexto enxuto — ficheiros otimizados + qmd, economizando 30-90% de tokens de entrada

3. Redução de chamadas — agrupar cron, alongar Heartbeat, ativar silêncio noturno

O Sonnet 4 já é bastante potente, para tarefas diárias nem se nota diferença. Quando precisar de Opus, troque facilmente.

*Baseado em experiência prática com múltiplos agentes, dados estimados e anonimizados.*
Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário