Voltar para notícias
claude.com
2 visualizações

Claude Adiciona Ferramentas Sem Código para Testar, Medir e Refinar Habilidades de Agentes - claude.com

Hoje, lançamos atualizações principais no Skill Creator do Claude.ai, facilitando testar, medir e refinar habilidades de agentes para construir agentes de uso de computador mais confiáveis mais rápido. Nova skill evaluator permite avaliar habilidades diretamente no Claude.ai: faça upload de ZIP, execute avaliações no cloud em máquina virtual, veja taxas de aprovação, quebras de erro e traces. Datasets iniciais para navegação web, análise de dados e codificação. Métricas: taxa de aprovação, eficiência, confiabilidade. Refine com traces, regeneração de ações e versionamento. Postado em 22 de outubro de 2024 por Alex Albert. Claude 3.5 Sonnet alimenta essas funções, disponível para usuários Pro/Max/Team/Enterprise.