Voltar para notícias
fortune.com
0 visualizações

Anthropic torna visíveis bloqueios de segurança em modelo de IA

Após críticas por rebaixar silenciosamente requisições, a Anthropic anuncia que passará a sinalizar abertamente quando seu modelo mais potente, Fable 5, recusar ou redirecionar perguntas por motivos de segurança nacional.

Anthropic torna visíveis bloqueios de segurança em modelo de IA
A Anthropic anunciou nesta quarta-feira que vai tornar visíveis os bloqueios de segurança aplicados pelo seu modelo de inteligência artificial mais avançado, o Fable 5. A decisão ocorre depois que pesquisadores e usuários criticaram a empresa por rebaixar silenciosamente certas requisições para uma versão menos capaz do modelo, sem qualquer aviso. Agora, quando uma solicitação for recusada ou redirecionada, o usuário verá uma notificação explícita e, na interface de programação (API), receberá o motivo da recusa. As restrições atingem principalmente solicitações relacionadas ao desenvolvimento de modelos concorrentes de IA, o que já é proibido pelos termos de serviço da empresa — prática que a Anthropic afirma ser padrão na indústria. Mas o componente mais sensível é o uso de critérios de segurança nacional. A empresa declarou que não deseja que adversários estrangeiros utilizem seu modelo para aprimorar suas próprias capacidades de IA em detrimento dos Estados Unidos e seus aliados. Como exemplo, citou a otimização de chips semicondutores por potências rivais, área em que o país mantém vantagem tecnológica. A mudança de postura reflete como as medidas de segurança em IA estão cada vez mais ligadas a debates geopolíticos. A Anthropic já viveu um embate com o Departamento de Guerra dos EUA, que no início do ano a classificou como um “risco à cadeia de suprimentos” por se recusar a ceder acesso total ao modelo Claude para uso em vigilância em massa e armas autônomas. O secretário Pete Hegseth rejeitou o recurso da empresa, abrindo uma disputa judicial. Agora, com o Fable 5, a empresa tenta equilibrar transparência com restrições de segurança — algo que admite ter feito de forma errada. “Fizemos a troca errada e pedimos desculpas por não acertar o equilíbrio”, disse um porta-voz. Para o mercado e a comunidade de pesquisa, a sinalização mais clara pode reduzir a desconfiança gerada por bloqueios invisíveis, mas não elimina o debate sobre o ritmo do avanço da inteligência artificial. Enquanto a Anthropic se prepara para um IPO confidencial aberto este mês, o episódio mostra que mesmo empresas que se posicionam como defensoras da segurança precisam lidar com a pressão entre inovação aberta e controle soberano de tecnologia.