1月21日、DeepSeekはDeepSeek-R1の記念日を記念して、MODEL1インデックスの更新モデルを発表しました。このイベントは、同社のポートフォリオにおけるモデルの積極的な開発を示し、今後1年間の野心的な計画を示しています。## FlashMLAコードによる新モデルの詳細公開BlockBeatsによると、FlashMLAリポジトリはGitHub上で更新され、MODEL1に関する重要な詳細が含まれています。コード分析では、114の異なるファイルで新モデルの言及が28件あり、同社のインフラへの統合の規模を示しています。MODEL1と並行して、V32が登場し、これはDeepSeek-V3.2とは根本的に異なるモデルであることが確認されました。## 技術革新と最適化ソースコードは技術的レベルで大きな違いを示しています。主な改善点はKVキャッシュ管理、スパーシティ計算、FP8形式でのデコードにあります。これらの最適化は、DeepSeekがモデルのメモリ効率と性能向上に注力していることを示しており、実用的な応用の拡大に不可欠です。したがって、新モデルは単なるアップデートではなく、アーキテクチャと機能面での質的な飛躍です。
DeepSeekがR1の1周年を祝うために新しいMODEL1を発表
1月21日、DeepSeekはDeepSeek-R1の記念日を記念して、MODEL1インデックスの更新モデルを発表しました。このイベントは、同社のポートフォリオにおけるモデルの積極的な開発を示し、今後1年間の野心的な計画を示しています。
FlashMLAコードによる新モデルの詳細公開
BlockBeatsによると、FlashMLAリポジトリはGitHub上で更新され、MODEL1に関する重要な詳細が含まれています。コード分析では、114の異なるファイルで新モデルの言及が28件あり、同社のインフラへの統合の規模を示しています。MODEL1と並行して、V32が登場し、これはDeepSeek-V3.2とは根本的に異なるモデルであることが確認されました。
技術革新と最適化
ソースコードは技術的レベルで大きな違いを示しています。主な改善点はKVキャッシュ管理、スパーシティ計算、FP8形式でのデコードにあります。これらの最適化は、DeepSeekがモデルのメモリ効率と性能向上に注力していることを示しており、実用的な応用の拡大に不可欠です。したがって、新モデルは単なるアップデートではなく、アーキテクチャと機能面での質的な飛躍です。