Voltar para notícias
anthropic.com
5 visualizações

Anthropic atualiza salvaguardas eleitorais do Claude, testes de viés e políticas antes de eleições globais

Em 30 de outubro de 2024, com a eleição presidencial dos EUA a dias, a Anthropic fortaleceu as salvaguardas do Claude contra mau uso eleitoral. As atualizações aplicam-se a todos os modelos Claude via Anthropic API, Amazon Bedrock, Google Vertex AI e claude.ai. Melhorias em três áreas: recusa criação de materiais enganosos como deepfakes, endossos falsos e screenshots fabricados; assistência a fraude como registro fraudulento e hacking; geração de desinformação sobre votação. Salvaguardas ativadas automaticamente para consultas sobre eleição dos EUA até 5 de novembro. Testes com mais de 100 prompts adversários: Claude recusou 100%; ~90% de consultas reais recusadas. Compartilham prompts do sistema em link fornecido.