Grok AI 模型達成新性能里程碑 — 最新基準測試結果



近期評估數據顯示,Grok 在2025年12月下旬的主要 AI 排行榜中占據主導地位。該模型處理約4890億個標記,確立了其在 OpenRouter 全面排名系統中的領先地位。

性能亮點顯示出顯著的市場優勢:Grok 擁有31.2%的類別標記份額,遠超競爭對手。語言處理能力顯示分配了1160億個標記,展現出在多語言環境中的專業優勢。

除了 OpenRouter 排名外,Grok 在多個技術基準測試中也保持頂尖位置——在衡量代碼生成和推理能力的 Kilo Code 和 Roo Code 排行榜上均獲得第一名。該模型還在 EQ-Bench3 評分指標中領先,顯示在多樣評估框架中持續表現卓越。

這些結果反映出大型語言模型性能的持續發展,並對 AI 基礎設施在科技生態系統和區塊鏈相關應用中的演變具有重要影響。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 7
  • 轉發
  • 分享
留言
0/400
NFT收藏癖vip
· 2025-12-31 02:02
grok這波確實牛,489億tokens直接碾壓其他模型,代碼生成也是第一...就是不知道這些benchmark是不是又開始互相吹了,web3那圈子最愛這套
查看原文回復0
ThesisInvestorvip
· 2025-12-30 20:16
grok這數據真的絕,489B tokens直接碾壓,31.2%的份額不是開玩笑...代碼生成那塊兒更牛逼,kilo code和roo code雙殺,這是認真的嗎
查看原文回復0
TokenToastervip
· 2025-12-28 10:49
Grok又開始秀肌肉了,31.2%的token佔有率...這數字是真的離譜還是benchmark又開始玩花樣了?
查看原文回復0
稳定币套利者vip
· 2025-12-28 10:45
說實話,4890億代幣和31.2%的主導地位在紙面上看起來很乾淨,但有人實際測試過這裡的延遲與吞吐量比率嗎?代碼基準測試很炫,但我更感興趣的是在大規模部署時的實際滑點指標
查看原文回復0
区块链打工人vip
· 2025-12-28 10:31
grok這波是真的硬啊,489億tokens直接碾壓...不過說實話排行榜這玩意兒水分也是有的,關鍵還是得看實際用起來怎樣吧
查看原文回復0
瀑布式抄底vip
· 2025-12-28 10:28
grok這數據是真的離譜,4890億代幣直接碾壓,31.2%市場份額?這差距有點誇張啊...不過code生成第一我倒是信,multilingual那塊確實強
查看原文回復0
雏菊独角兽vip
· 2025-12-28 10:26
489億tokens啊,這花兒開得有點猛啊...不過排行榜這玩意兒,看著爽就行呗
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)