Plano de Codificação do Motor de Vulcões exposto com cobrança em duas camadas: supostamente por número de vezes, na prática também desconta por consumo de tokens convertido em créditos

BlockBeatNews

De acordo com o monitorização de 1M AI News, o modelo de faturação do plano de Coding Plan da Volcano Engine (Ark) foi descoberto por utilizadores como tendo mecanismos ocultos não devidamente divulgados. Um programador relatou no V2EX que a velocidade de consumo de quota é muito superior à de pacotes semelhantes noutras plataformas; após contactar o apoio ao cliente, recebeu a seguinte resposta: «Se os Tokens consumidos por uma única chamada de modelo forem significativamente superiores aos consumidos numa chamada média, então o número de chamadas estimadas disponíveis no período também será significativamente inferior a 6,000.»

Por exemplo, no pacote Pro (200 yuan/mês), a quota anunciada é de 6,000 pedidos a cada 5 horas, 45,000 pedidos por semana e 90,000 pedidos por mês. Porém, a cobrança real não funciona como “uma chamada = um desconto”; em vez disso, converte o consumo de tokens de uma única chamada em múltiplas cobranças. A fórmula de conversão apurada pelo utilizador é usage = max(round(use_token/token_limit), 1). As taxas de conversão ocultas variam entre modelos: DeepSeek-V3.2 é cerca de 2x, Doubao-Seed-2.0-Code cerca de 4x, e Doubao-Seed-2.0-Pro cerca de 6x. Ou seja, uma única chamada do Doubao-Seed-2.0-Pro pode ser contabilizada como 6 consumos da quota.

O utilizador citou um exemplo: uma única chamada consome 510,000 tokens; noutras plataformas como Ali Baolian conta apenas como uma vez, enquanto na Volcano Engine pode ser convertida para cerca de 20 vezes. Na execução de tarefas complexas por agentes de programação em IA (AI programming Agent), é comum que uma única chamada consuma centenas de milhares de tokens, até dezenas de milhares. Este modelo de faturação levaria a que a quota do pacote fosse esgotada rapidamente.

Os pacotes do Coding Plan no mercado interno chinês são, em geral, cobrados por número de chamadas; plataformas como Ali Baolian e Xiaomi MiMo também descontam uma vez por chamada, sem conversão por tokens. A dupla camada “anunciada por número de chamadas, convertida por tokens” da Volcano Engine é relativamente rara na indústria, e não é explicada de forma evidente numa posição destacada na página do pacote; os utilizadores só conseguem ficar a conhecer este mecanismo após um consumo anormal e, então, contactar o apoio ao cliente. A ferramenta de programação em IA Trae, da ByteDance, foi igualmente alvo de reclamações recentes de utilizadores, que indicam que passou de cobrança puramente por chamadas para um método semelhante de conversão por tokens para contar as chamadas.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários