•x.com•
0 visualizações
Datacurve Lança Benchmark DeepSWE para Modelos de Codificação de Agentes
A Datacurve lançou o DeepSWE, um novo benchmark para avaliar modelos de codificação de agentes. A ferramenta busca medir a capacidade desses sistemas em realizar tarefas complexas de engenharia de software de forma autônoma. O anúncio foi feito sem detalhes específicos sobre as métricas exatas ou datas de lançamento.