Voltar para notícias
x.com
0 visualizações

Datacurve Lança Benchmark DeepSWE para Modelos de Codificação de Agentes

A Datacurve lançou o DeepSWE, um novo benchmark para avaliar modelos de codificação de agentes. A ferramenta busca medir a capacidade desses sistemas em realizar tarefas complexas de engenharia de software de forma autônoma. O anúncio foi feito sem detalhes específicos sobre as métricas exatas ou datas de lançamento.