A Controvérsia da Esteganografia da Anthropic Explicada em Termos Não Técnicos

Zarar Siddiqi, 1 de julho de 2026
Link para o Artigo original: [Zarar's Blog]
Tempo de leitura: 2 minutos

É possível que já tenha ouvido dizer que a Anthropic foi apanhada a fazer algo suspeito, algo que quero explicar sem recorrer a termos técnicos, porque a lição serve para todos, especialmente se estás a pagar por ferramentas de IA ou a decidir se a tua equipa deve usá-las.

Alguém analisou os componentes internos do Claude Code e descobriu que ele estava a fazer algo discretamente, sem que a empresa tivesse informado ninguém. Não era exatamente algo malicioso, mas a questão é que estava oculto do utilizador.

Sempre que o Claude Code enviava uma mensagem do utilizador para o servidor (isto é, um prompt), introduzia uma pequena alteração insignificante naquilo que era enviado do teu computador para a Anthropic. Em vez de enviar uma data no formato AAAA-MM-DD, enviava-a como AAAA/MM/DD (repara no hífen substituído por uma barra) sempre que o utilizador era de certas regiões da China. Também fazia algo semelhante se estivesses a usar o Claude através de um revendedor, etc. Os detalhes do que enviavam não são o ponto importante, mas sim como enviavam.

As empresas recolhem informações sobre os seus utilizadores a toda a hora, por isso essa parte não é o problema. Se a Anthropic quisesse saber quem são os seus utilizadores, podia simplesmente perguntar ou transmitir essa informação de forma clara, algo como {"localização": "Xangai"}, como parte dos dados enviados do teu Claude Code para os servidores da Anthropic. O que incomoda as pessoas é a forma como o fizeram.

A Anthropic controla toda a cadeia — a ferramenta é deles e os servidores são deles. Se quisessem esta informação, podiam tê-la escrito de forma clara, à vista de todos, como qualquer empresa normal faz. Em vez disso, escolheram ocultá-la, e ocultá-la precisamente na parte da mensagem em que um programador mais confia: o prompt. É como um empreiteiro que contratas e que escreve notas sobre ti com tinta invisível, precisamente nos documentos que te devolve. Isto é conhecido como esteganografia, a prática de esconder informação secreta dentro de uma peça de informação comum e aparentemente inócua.

Não se esconde aquilo que se tem permissão para fazer. Esconde-se aquilo que não se quer que a outra pessoa saiba que se fez. Isto está a irritar as pessoas porque, se fazem algo assim aqui, é difícil acreditar que não o farão também noutros sítios, e torna-se mais difícil confiar na sua palavra no que diz respeito à segurança e à privacidade. E ninguém teria sabido, não fosse uma pessoa ter decidido desmontar o software — e é esse o problema: o facto de só termos descoberto por acidente.

Estas ferramentas de IA já não são simples janelas de conversa. São agentes que correm nos nossos computadores com acesso total à nossa máquina. Podem executar comandos, ler os nossos ficheiros e ligar-se à Internet, tudo em nosso nome. Damos-lhes as chaves de casa porque elas fazem algo genuinamente útil por nós, e confiamos nelas inerentemente.

Pensemos nisto. Uma empresa lançou um software que corre na tua máquina com as chaves para tudo, e esse software estava a fazer algo discretamente, sem nunca ter sido divulgado. A marca oculta (por exemplo, a troca do hífen pela barra para identificar utilizadores chineses) não era nada de grave por si só, mas prova que estão dispostos a executar coisas que não podes ver. E não se pode verificar aquilo que não se vê. No fundo, confias mais em quem te mostra o seu trabalho do que em quem diz "confia em mim". A transparência conquista confiança; ocultá-la, perde-a. E esta é uma prova cristalina de que a Anthropic se esforçou por ocultar algo de ti.

Já agora, a forma como o fizeram foi tão descuidada que nos faz questionar se os programadores das "grandes tecnológicas" são realmente aquilo que dizem ser.

Onde é que isto nos deixa? Penso que é um verdadeiro argumento a favor de executar estas ferramentas em modelos de IA que possas executar tu mesmo, na tua própria máquina, onde os teus dados e o teu trabalho nunca saem do edifício. Os modelos locais (como aquele sobre o qual escrevi aqui) ainda não são tão sofisticados como os maiores, e "aberto" não significa automaticamente "seguro", mas a direção de executar mais coisas localmente é a correta (mesmo sem considerar o ângulo dos custos). Deves procurar ferramentas nas quais consigas ver o interior.

Não estou a dizer a ninguém para deitar fora as suas ferramentas amanhã. Estou a dizer que, quando escolheres em quem confiar com as chaves, presta menos atenção ao que uma empresa promete e mais a se podes verificar por ti mesmo. Aqueles que merecem confiança são os que não te pedem para acreditar na palavra deles.

comentar post via email tekelilitekelili@proton.me