作者:xiyu
Quer usar Claude Opus 4.6 mas não quer que a fatura do final do mês exploda? Este artigo ajuda a cortar entre 60-85% dos custos.
Achava que tokens eram apenas “o que você diz + a resposta da IA”? Na realidade, muito mais.
Custos ocultos de cada conversa:
Um simples “Como está o tempo hoje” consome na prática entre 8000-15000 tokens de entrada. Usando Opus, só o contexto custa entre $0.12-0.22.
Cron ainda mais agressivo: cada disparo = nova conversa = reinjetar todo o contexto. Um cron que roda a cada 15 minutos, 96 vezes por dia, com Opus, sai entre $10-20 por dia.
Heartbeat funciona do mesmo jeito: é uma chamada de diálogo, quanto mais curto o intervalo, mais caro.
A maior economia, com maior impacto. Sonnet custa cerca de 1/5 de Opus, e cobre 80% das tarefas diárias.
Prompt:
Por favor, configure o modelo padrão do OpenClaw para Sonnet,
use Opus apenas para análises profundas ou criação de conteúdo.
Especificamente:
1) Modelo padrão como Sonnet
2) Tarefas cron padrão usando Sonnet
3) Apenas tarefas de escrita, análises complexas, especifique Opus
**Cenários Opus:** textos longos, códigos complexos, raciocínio em múltiplas etapas, tarefas criativas
**Cenários Sonnet:** conversas cotidianas, perguntas simples, verificações cron, heartbeat, manipulação de ficheiros, traduções
**Teste: após a troca, custo mensal cai 65%, experiência quase igual.**
Cada chamada tem um “ruído de fundo” de 3000-14000 tokens. Otimizar a injeção de ficheiros é a melhor relação custo-benefício.
Prompt:
Ajude a simplificar os ficheiros de contexto do OpenClaw para economizar tokens.
Especificamente:
1) Remova partes desnecessárias do AGENTS.md (regras de grupo, TTS, funções não usadas), comprima para menos de 800 tokens
2) Resuma o SOUL.md em pontos essenciais, entre 300-500 tokens
3) Limpe informações expiradas do MEMORY.md, mantendo até 2000 tokens
4) Verifique a configuração workspaceFiles, remova ficheiros de injeção desnecessários
Regra prática: a cada 1000 tokens removidos na injeção, estima-se uma economia de cerca de $45 por mês, considerando 100 chamadas diárias ao Opus.
Prompt:
Ajude a otimizar as tarefas cron do OpenClaw para economizar tokens.
Por favor:
1) Liste todas as tarefas cron, suas frequências e modelos usados
2) Reduza tarefas não criativas para Sonnet
3) Combine tarefas que rodam no mesmo período (por exemplo, várias verificações em uma só)
4) Diminua a frequência de tarefas desnecessárias (por exemplo, de 10 para 30 minutos para verificações do sistema, de 3 para 1 por dia para verificações de versão)
5) Configure delivery para notificações sob demanda, sem enviar mensagens desnecessárias
Princípio central: mais frequente nem sempre é melhor. A maioria das necessidades "em tempo real" é falsa. Agrupar 5 verificações independentes em uma única chamada economiza cerca de 75% do custo de injeção de contexto.
Prompt:
Ajude a otimizar a configuração do Heartbeat do OpenClaw:
1) Intervalo de trabalho entre 45-60 minutos
2) Período de silêncio das 23:00 às 08:00
3) Simplifique o HEARTBEAT.md ao mínimo possível
4) Agrupe verificações dispersas em execuções em lote no heartbeat
Ao consultar fontes, o agente normalmente lê “todo o texto” — um ficheiro de 500 linhas pode ter 3000-5000 tokens, mas só precisa de 10 linhas. 90% dos tokens de entrada são desperdiçados.
qmd é uma ferramenta de busca semântica local, que cria um índice de texto completo + vetores, permitindo ao agente localizar precisamente os parágrafos necessários, sem ler tudo. Tudo local, sem custos de API.
Usando com mq (Mini Query): pré-visualizar estrutura, extrair parágrafos específicos, buscar palavras-chave — cada consulta lê apenas 10-30 linhas.
Prompt:
Configure o qmd para buscar conhecimento e economizar tokens.
Endereço no Github: https://github.com/tobi/qmd
Requisitos:
1) Instale o qmd
2) Crie o índice do diretório de trabalho
3) Adicione regras de busca no AGENTS.md, forçando o agente a usar qmd/mq antes de ler tudo
4) Configure atualizações periódicas do índice
Resultado esperado: reduzir de 15000 para 1500 tokens por consulta, uma economia de 90%.
Diferença do memorySearch: o memorySearch "recupera" (MEMORY.md), o qmd "consulta" (base de conhecimento personalizada), sem interferir um no outro.
Prompt:
Configure o memorySearch do OpenClaw.
Se meus ficheiros de memória são poucos (algumas dezenas de md),
recomenda usar embedding local ou Voyage AI?
Explique custos e diferenças na qualidade de busca.
**Conclusão simples:** com poucos ficheiros, embeddings locais (zero custo); com muitos ficheiros ou necessidade de múltilíngue, Voyage AI (2 bilhões de tokens gratuitos por conta).
Prompt:
Ajude-me a otimizar toda a configuração do OpenClaw de uma só vez para maximizar a economia de tokens, seguindo este checklist:
- Modelo padrão: Sonnet, apenas usar Opus para tarefas de criação/análise
- Simplificar AGENTS.md, SOUL.md, MEMORY.md
- Reduzir todas as tarefas cron para Sonnet + combinar + diminuir frequência
- Intervalo do Heartbeat para 45 minutos + silêncio noturno
- Configurar qmd para busca precisa, substituindo leitura completa
- Manter apenas ficheiros essenciais em workspaceFiles
- Limpar periodicamente MEMORY.md, mantendo até 2000 tokens
Benefício de uma configuração única:
1. Camadas do modelo — Sonnet para rotina, Opus para tarefas críticas, economizando 60-80%
2. Contexto enxuto — ficheiros otimizados + qmd, economizando 30-90% de tokens de entrada
3. Redução de chamadas — agrupar cron, alongar Heartbeat, ativar silêncio noturno
O Sonnet 4 já é bastante potente, para tarefas diárias nem se nota diferença. Quando precisar de Opus, troque facilmente.
*Baseado em experiência prática com múltiplos agentes, dados estimados e anonimizados.*