Voltar para notícias
theinformation.com
3 visualizações

DeepSeek lançará modelo de IA V4 com capacidades avançadas de codificação em breve - theinformation.com

A startup chinesa DeepSeek planeja lançar seu próximo modelo de linguagem grande, DeepSeek-V3, já nesta semana, segundo duas pessoas familiarizadas. O modelo tem fortes habilidades de codificação, competindo com tops da OpenAI e Anthropic. Preview no Hugging Face com mais de 100 mil downloads. Treinado com 15 trilhões de tokens, 671 bilhões de parâmetros (37 bilhões ativados por token), nova arquitetura 'multi-head latent attention'. DeepSeek-V2, de maio, superou rivais em matemática e codificação com custo baixo. Fundada em 2023 por Liang Wenfeng.