Gate 广場「創作者認證激勵計畫」優質創作者持續招募中!
立即加入,發布優質內容,參與活動即可瓜分月度 $10,000+ 創作獎勵!
認證申請步驟:
1️⃣ 打開 App 首頁底部【廣場】 → 點擊右上角頭像進入個人首頁
2️⃣ 點擊頭像右下角【申請認證】,提交申請等待審核
立即報名:https://www.gate.com/questionnaire/7159
豪華代幣獎池、Gate 精美周邊、流量曝光等超過 $10,000 的豐厚獎勵等你拿!
活動詳情:https://www.gate.com/announcements/article/47889
DeepSeek 推出全新 MODEL1,慶祝 R1 成立一週年
1 月 21 日,DeepSeek 慶祝 DeepSeek-R1 週年,推出了更新版的 MODEL1 指數模型。此活動顯示該模型在公司產品組合中的積極開發,並展現出對未來一年的雄心壯志。
透過 FlashMLA 程式碼揭露新模型細節
根據 BlockBeats 的報導,FlashMLA 倉庫已在 GitHub 上更新,包含了關於 MODEL1 的重要細節。程式碼分析顯示,在114個不同檔案中,有28次提及新模型,顯示其整合到公司基礎設施的規模。與 MODEL1 並行出現 V32,證實這是與 DeepSeek-V3.2 根本不同的模型。
技術創新與優化
原始碼在技術層面上顯示出顯著差異。主要改進包括KV快取管理、稀疏性運算以及FP8格式解碼。這些優化顯示 Deepseek 專注於提升模型的記憶體效率與效能,這對於擴大其實際應用至關重要。因此,新模型不僅是更新,更是架構與功能的質的飛躍。