DeepSeek 推出新款 MODEL1,庆祝 R1 成立一周年

robot
摘要生成中

1月21日,DeepSeek通过推出带有MODEL1指数的更新模型,庆祝DeepSeek-R1周年纪念。此次活动表明该车型在公司产品组合中的积极发展,并展示了对未来一年的雄心勃勃的规划。

通过FlashMLA代码揭示新型号细节

据BlockBeats报道,FlashMLA仓库已在GitHub上更新,包含了关于MODEL1的重要细节。代码分析显示,在114个不同文件中提到了新车型28次,显示了其与公司基础设施整合的规模。与MODEL1并行出现的V32,确认这是与DeepSeek-V3.2根本不同的模型。

技术创新与优化

源代码在技术层面上显示出显著差异。主要改进体现在KV缓存管理、稀疏计算以及FP8格式解码方面。这些优化表明DeepSeek专注于提升模型的内存效率和性能,这对于其实际应用的扩展至关重要。因此,新模型不仅仅是一次更新,更是架构和功能的质的飞跃。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)