DeepSeek lança novo MODEL1 para celebrar o primeiro aniversário da R1

robot
Geração de resumo em curso

A 21 de janeiro, a DeepSeek celebrou o aniversário do DeepSeek-R1 com a introdução de um modelo atualizado com o índice MODEL1. Este evento indica o desenvolvimento ativo do modelo no portefólio da empresa e demonstra planos ambiciosos para o próximo ano.

Revelando Novos Detalhes do Modelo através do Código FlashMLA

Segundo o BlockBeats, o repositório FlashMLA foi atualizado no GitHub, contendo detalhes importantes sobre o MODEL1. A análise do código mostrou 28 menções ao novo modelo em 114 ficheiros diferentes, o que indica a escala da sua integração na infraestrutura da empresa. Em paralelo com o MODEL1, surge o V32, confirmando que este é um modelo fundamentalmente diferente do DeepSeek-V3.2.

Inovação Técnica e Otimização

O código-fonte revela diferenças significativas a nível tecnológico. As principais melhorias são na gestão de cache KV, computação de esparsidade e decodificação em formato FP8. Estas otimizações indicam o foco da DeepSeek em melhorar a eficiência de memória e o desempenho do modelo, o que é fundamental para escalar a sua aplicação prática. Assim, o novo modelo não é apenas uma atualização, mas um salto qualitativo na arquitetura e funcionalidade.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar

Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)