2025-12-28 10:22:45

Grok AI 模型達成新性能里程碑 — 最新基準測試結果

近期評估數據顯示，Grok 在2025年12月下旬的主要 AI 排行榜中占據主導地位。該模型處理約4890億個標記，確立了其在 OpenRouter 全面排名系統中的領先地位。

性能亮點顯示出顯著的市場優勢：Grok 擁有31.2%的類別標記份額，遠超競爭對手。語言處理能力顯示分配了1160億個標記，展現出在多語言環境中的專業優勢。

除了 OpenRouter 排名外，Grok 在多個技術基準測試中也保持頂尖位置——在衡量代碼生成和推理能力的 Kilo Code 和 Roo Code 排行榜上均獲得第一名。該模型還在 EQ-Bench3 評分指標中領先，顯示在多樣評估框架中持續表現卓越。

這些結果反映出大型語言模型性能的持續發展，並對 AI 基礎設施在科技生態系統和區塊鏈相關應用中的演變具有重要影響。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

12人按讚了這條動態

讚賞
12
7
轉發
分享

留言

0/400

NFT收藏癖

· 2025-12-31 02:02

grok這波確實牛，489億tokens直接碾壓其他模型，代碼生成也是第一...就是不知道這些benchmark是不是又開始互相吹了，web3那圈子最愛這套

查看原文回復0

ThesisInvestor

· 2025-12-30 20:16

grok這數據真的絕，489B tokens直接碾壓，31.2%的份額不是開玩笑...代碼生成那塊兒更牛逼，kilo code和roo code雙殺，這是認真的嗎

查看原文回復0

TokenToaster

· 2025-12-28 10:49

Grok又開始秀肌肉了，31.2%的token佔有率...這數字是真的離譜還是benchmark又開始玩花樣了？

查看原文回復0

稳定币套利者

· 2025-12-28 10:45

說實話，4890億代幣和31.2%的主導地位在紙面上看起來很乾淨，但有人實際測試過這裡的延遲與吞吐量比率嗎？代碼基準測試很炫，但我更感興趣的是在大規模部署時的實際滑點指標

查看原文回復0

区块链打工人

· 2025-12-28 10:31

grok這波是真的硬啊，489億tokens直接碾壓...不過說實話排行榜這玩意兒水分也是有的，關鍵還是得看實際用起來怎樣吧

查看原文回復0

CascadingDipBuyer

· 2025-12-28 10:28

grok這數據是真的離譜，4890億代幣直接碾壓，31.2%市場份額？這差距有點誇張啊...不過code生成第一我倒是信，multilingual那塊確實強

查看原文回復0

雏菊独角兽

· 2025-12-28 10:26

489億tokens啊，這花兒開得有點猛啊...不過排行榜這玩意兒，看著爽就行呗

查看原文回復0

熱門話題
查看更多
#
Gate2月透明度報告
7.87萬熱度
#
加密市場上漲
41.69萬熱度
#
川普稱伊朗戰事接近尾聲
5.51萬熱度
#
微策略再砸12.8億美元增持BTC
8624.07萬熱度
#
黃金白銀走高
19.89萬熱度

熱門 Gate Fun
查看更多

1
🥥
椰子狗
市值:$0.1持有人數:0
0.00%
2
gjkgga
Lobster
市值:$0.1持有人數:1
0.00%
3
BTW
比特王
市值:$2441.37持有人數:1
0.00%
4
龙虾
龙虾
市值:$2577.65持有人數:3
0.85%
5
🦞
OpenClaw
市值:$2464.97持有人數:2
0.06%

Grok AI 模型達成新性能里程碑 — 最新基準測試結果

熱門話題

Gate2月透明度報告

加密市場上漲

川普稱伊朗戰事接近尾聲

微策略再砸12.8億美元增持BTC

黃金白銀走高

熱門 Gate Fun

🥥

椰子狗

gjkgga

Lobster

BTW

比特王

龙虾

龙虾

🦞

OpenClaw

置頂