Claude Code admitiu ter inserido «código espião» para utilizadores chineses para evitar a venda de água e destilação, só retirando após exposição.

A Anthropic, conhecida pelo lema "Segurança e Alinhamento", o engenheiro da equipa Claude Code, Thariq, respondeu publicamente à recente revelação bombástica sobre a "lei do spyware", admitindo abertamente que a empresa incorporou em março deste ano um mecanismo experimental no produto que deteta se o fuso horário do sistema é Asia/Shanghai ou Asia/Urumqi, se o nome do host do proxy corresponde a revendedores relacionados com a China, e depois, usando pontuação especial através de esteganografia, injeta silenciosamente nas instruções do sistema marcas invisíveis para os humanos, mas que podem ser interpretadas pelo servidor. Ele afirmou que o objetivo era "prevenir o uso indevido de contas por revendedores não autorizados e a destilação de modelos", e salientou que já acelerou a descontinuação e que as versões futuras irão reverter completamente. (Resumo anterior: Claude Sonnet 5 lançado: Anthropic afirma que várias métricas se aproximam do Opus, com preço mais baixo) (Contexto adicional: Fable 5 e Mythos 5 estão de volta! Anthropic anuncia relançamento para amanhã) Resumo

  • O engenheiro do Claude Code, Thariq, admitiu que em março deste ano incorporou um mecanismo experimental que deteta fusos horários chineses e nomes de host de proxy, e usa esteganografia para injetar marcadores ocultos nas instruções do sistema
  • Detalhes do mecanismo: quando o fuso horário é Asia/Shanghai ou Asia/Urumqi, o separador de data muda de "-" para "/", e substitui o apóstrofo em "Today's date" por caracteres Unicode visualmente idênticos
  • Thariq afirma que o objetivo é prevenir o uso indevido por revendedores não autorizados e a destilação de modelos, e que a versão de amanhã (2.1.197) reverterá completamente; mas a comunidade critica que "só removeu quando foi apanhado, sem notificar os utilizadores", causando graves danos à confiança A própria Anthropic, conhecida pelo lema "Segurança e Alinhamento", admite as suas práticas anti-destilação. O engenheiro da equipa Claude Code, Thariq, respondeu publicamente à recente revelação bombástica sobre o "código espião", admitindo abertamente que a empresa incorporou em março deste ano um mecanismo experimental no produto, que, sem o conhecimento dos utilizadores, realiza a marcação de impressões digitais do ambiente para utilizadores relacionados com a China. De acordo com as declarações de Thariq e o conteúdo da revelação, este mecanismo deteta três coisas: se o fuso horário do sistema é Asia/Shanghai ou Asia/Urumqi, se o nome do host do proxy de rede corresponde a uma lista de revendedores relacionados com a China, e se correspondem a palavras-chave de laboratórios de IA específicos. O resultado da avaliação não é escrito explicitamente, mas sim, através de pontuação especial, usando "esteganografia", é injetado secretamente como marcadores ocultos nas instruções do sistema.

Códigos identificáveis escondidos

Esteganografia refere-se a esconder informações em conteúdo aparentemente normal. O que é engenhoso (ou talvez insidioso) neste mecanismo é que, quando deteta um fuso horário chinês, o separador de data na linha "Today's date is" nas instruções do sistema muda silenciosamente de hífen "-" para barra "/", por exemplo, 2026-06-30 torna-se 2026/06/30; ao mesmo tempo, o apóstrofo em "Today's date" alterna entre três caracteres Unicode visualmente quase idênticos, mas com codificações diferentes, para indicar se o proxy corresponde a um domínio chinês, se referencia um laboratório de IA chinês, ou ambos. O mais crucial é que estas alterações são completamente invisíveis para os utilizadores humanos, e talvez até mesmo para o próprio modelo de IA, mas podem ser facilmente interpretadas pelos servidores da Anthropic. De acordo com relatos estrangeiros, este comportamento apareceu nas versões 2.1.193 a 2.1.196 do Claude Code, e lógica semelhante remonta à versão 2.1.91 do início de abril.

Anthropic diz que é anti-destilação, a comunidade diz que é vigilância secreta

A razão dada por Thariq é defensiva. Afirma que o mecanismo visa "prevenir o uso indevido de contas por revendedores não autorizados e a destilação de modelos", e salienta que a equipa implementou desde então medidas de proteção mais fortes, "sempre teve a intenção de descontinuá-lo", e que os PRs relacionados foram fundidos, com previsão de reversão completa no lançamento da versão de amanhã (2.1.197). Em fevereiro deste ano, a Anthropic, a OpenAI e o Google revelaram simultaneamente ataques de destilação de modelos em escala industrial. A Anthropic acusou especificamente a DeepSeek, a Moonshot AI e a MiniMax de utilizarem mais de 24.000 contas fraudulentas, gerando mais de 16 milhões de conversas, para treinar modelos concorrentes. Para estes gigantes da IA, conter a destilação e a apropriação indevida é uma dor real. O problema é que esta revelação foi publicada pela conta de segurança @IntCyberDigest em 30 de junho, acompanhada de duas capturas de tela de código, confirmando diretamente que "os utilizadores não tinham conhecimento". Embora a resposta de Thariq tenha sido uma admissão direta, a cronologia de "lançado em março, só acelerou a remoção após a exposição" continua a levantar dúvidas generalizadas na comunidade.

A secção de comentários criticou quase unanimemente a Anthropic por "só dizer que vai remover quando é apanhado" e "vigiar secretamente sem notificar os utilizadores", causando um grave impacto na confiança na imagem da empresa que se orgulhava de ser a "mais focada em segurança e ética". A anti-destilação tornou-se um tema de ataque e defesa entre os dois principais campos de IA, China e EUA. Será que os meios correspondentes precisam de ser totalmente divulgados? Do ponto de vista comercial, é impossível. Perguntas Frequentes O que exatamente fez o "código espião" do Claude Code? Segundo a revelação e a admissão do engenheiro Thariq, o Claude Code incorporou um mecanismo experimental que deteta se o fuso horário do utilizador é chinês (Asia/Shanghai, Asia/Urumqi), se o nome do host do proxy corresponde a revendedores chineses, e depois, usando pontuação Unicode especial através de esteganografia, injeta nas instruções do sistema marcadores invisíveis para humanos, mas interpretáveis pelo servidor. Porque é que a Anthropic fez isto? Já foi removido? Thariq afirma que o objetivo é prevenir o uso indevido de contas por revendedores não autorizados e a destilação de modelos. Em fevereiro deste ano, a Anthropic acusou a DeepSeek e outras empresas chinesas de IA de usarem um grande número de contas fraudulentas para destilar os seus modelos. Ele afirma que os PRs relacionados foram fundidos e que a versão de amanhã (2.1.197) reverterá completamente o mecanismo.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado