DeepSeekがR1の1周年を祝うために新しいMODEL1を発表

robot
概要作成中

1月21日、DeepSeekはDeepSeek-R1の記念日を記念して、MODEL1インデックスの更新モデルを発表しました。このイベントは、同社のポートフォリオにおけるモデルの積極的な開発を示し、今後1年間の野心的な計画を示しています。

FlashMLAコードによる新モデルの詳細公開

BlockBeatsによると、FlashMLAリポジトリはGitHub上で更新され、MODEL1に関する重要な詳細が含まれています。コード分析では、114の異なるファイルで新モデルの言及が28件あり、同社のインフラへの統合の規模を示しています。MODEL1と並行して、V32が登場し、これはDeepSeek-V3.2とは根本的に異なるモデルであることが確認されました。

技術革新と最適化

ソースコードは技術的レベルで大きな違いを示しています。主な改善点はKVキャッシュ管理、スパーシティ計算、FP8形式でのデコードにあります。これらの最適化は、DeepSeekがモデルのメモリ効率と性能向上に注力していることを示しており、実用的な応用の拡大に不可欠です。したがって、新モデルは単なるアップデートではなく、アーキテクチャと機能面での質的な飛躍です。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン