Gate 广场「创作者认证激励计划」优质创作者持续招募中!
立即加入,发布优质内容,参与活动即可瓜分月度 $10,000+ 创作奖励!
认证申请步骤:
1️⃣ 打开 App 首页底部【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】,提交申请等待审核
立即报名:https://www.gate.com/questionnaire/7159
豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000 丰厚奖励等你拿!
活动详情:https://www.gate.com/announcements/article/47889
DeepSeek 推出新款 MODEL1,庆祝 R1 成立一周年
1月21日,DeepSeek通过推出带有MODEL1指数的更新模型,庆祝DeepSeek-R1周年纪念。此次活动表明该车型在公司产品组合中的积极发展,并展示了对未来一年的雄心勃勃的规划。
通过FlashMLA代码揭示新型号细节
据BlockBeats报道,FlashMLA仓库已在GitHub上更新,包含了关于MODEL1的重要细节。代码分析显示,在114个不同文件中提到了新车型28次,显示了其与公司基础设施整合的规模。与MODEL1并行出现的V32,确认这是与DeepSeek-V3.2根本不同的模型。
技术创新与优化
源代码在技术层面上显示出显著差异。主要改进体现在KV缓存管理、稀疏计算以及FP8格式解码方面。这些优化表明DeepSeek专注于提升模型的内存效率和性能,这对于其实际应用的扩展至关重要。因此,新模型不仅仅是一次更新,更是架构和功能的质的飞跃。