2025-12-28 10:22:45

Grok AI 模型创下新性能里程碑——最新基准测试结果

最新评估数据显示，截止2025年12月下旬，Grok在主要AI排行榜上占据主导地位。该模型处理大约4890亿个标记，确立了其在OpenRouter全面排名系统中的领先地位。

性能亮点显示出显著的市场优势：Grok占据了31.2%的类别标记份额，远超竞争对手。语言处理能力方面，分配了1160亿个标记，展现出在多语言环境中的专业优势。

除了OpenRouter排名外，Grok在多个技术基准测试中也保持顶尖位置——在衡量代码生成和推理能力的Kilo Code和Roo Code排行榜上均名列第一。该模型还在EQ-Bench3评分指标中领先，显示出在各种评估框架中的持续卓越表现。

这些结果反映了大型语言模型性能的持续发展，对AI基础设施在技术生态系统和区块链相关应用中的演变具有重要意义。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

8人点赞了这条动态

赞赏
8
5
转发
分享

0/400

TokenToaster

· 17小时前

Grok又开始秀肌肉了，31.2%的token占有率...这数字是真的离谱还是benchmark又开始玩花样了？

稳定币套利者

· 17小时前

说实话，4890亿个代币和31.2%的市场份额在纸面上看起来很漂亮，但有人真正测试过这里的延迟与吞吐量的比例吗？代码基准测试虽然炫酷，但我更关心在大规模部署时的实际滑点指标。

查看原文回复0

区块链打工人

· 17小时前

grok这波是真的硬啊，489亿tokens直接碾压...不过说实话排行榜这玩意儿水分也是有的，关键还是得看实际用起来怎样吧

瀑布式抄底

· 17小时前

grok这数据是真的离谱，489billion tokens直接碾压，31.2%市场份额？这差距有点夸张啊...不过code生成第一我倒是信，multilingual那块确实强

雏菊独角兽

· 17小时前

489亿tokens啊，这花儿开得有点猛啊...不过排行榜这玩意儿，看着爽就行呗

热门话题
查看更多
#
2025Gate年度账单
13.03万热度
#
加密行情预测
117 热度
#
比特币与黄金战争
21 热度
#
ETF杠杆交易嘉年华
1258 热度
#
稳定币总市值年增长70%
25 热度

热门 Gate Fun
查看更多

1
12.29
12.29
市值:$3624.13持有人数:1
0.00%
2
DUMP
BTC DUMP
市值:$3596.55持有人数:1
0.00%
3
$AET
AETHER
市值:$3676.25持有人数:2
0.35%
4
POORGUYS13
POORGUYS
市值:$3619.25持有人数:2
0.09%
5
击鼓传花2.0
击鼓传花2.0
市值:$3565.51持有人数:1
0.00%

Grok AI 模型创下新性能里程碑——最新基准测试结果

热门话题

2025Gate年度账单

加密行情预测

比特币与黄金战争

ETF杠杆交易嘉年华

稳定币总市值年增长70%

热门 Gate Fun

12.29

12.29

DUMP

BTC DUMP

$AET

AETHER

POORGUYS13

POORGUYS

击鼓传花2.0

击鼓传花2.0

置顶