Voltar para notícias
anthropic.com
0 visualizações

Anthropic lança Índice de Fluência em IA rastreando 11 comportamentos em milhares de chats Claude.ai

A Anthropic lançou o Índice de Fluência em IA (AFI), benchmark para medir fluência em IA em humanos, em 15 de outubro de 2024. Avalia habilidades como prompting, uso de ferramentas e refinamento iterativo em 20 tarefas de cinco domínios. Estudo piloto com 1.000 participantes dos EUA: mediana de 45/100; grads universitários 62, ensino médio 38, trabalhadores tech 78, não-tech 42. Prompting forte (65%), uso de ferramentas fraco (32%). Correlação uso-fluência r=0.72. Usa Claude 3.5 Sonnet; open source no GitHub.