2025-12-28 10:22:45

Grok AI Model достигает нового рубежа в производительности — последние результаты бенчмарков

Недавние данные оценки показывают, что Grok занимает доминирующие позиции на основных лидербордах ИИ по состоянию на конец декабря 2025 года. Модель обрабатывает примерно 489 миллиардов токенов, закрепляя за собой статус ведущего исполнителя в комплексной системе рейтингов OpenRouter.

Основные показатели эффективности демонстрируют значительное доминирование на рынке: Grok занимает 31,2% доли токенов в категории, значительно опережая конкурентов. Возможности обработки языка показывают выделение 116 миллиардов токенов, что свидетельствует о специализированной силе в многоязычных контекстах.

Помимо рейтингов OpenRouter, Grok сохраняет ведущие позиции на нескольких технических бенчмарках — занимает первое место как в Kilo Code, так и в Roo Code, которые измеряют возможности генерации кода и рассуждения. Модель также лидирует по метрикам оценки EQ-Bench3, что свидетельствует о стабильном превосходстве в различных оценочных рамках.

Эти результаты отражают продолжающееся развитие производительности больших языковых моделей, что имеет значение для эволюции инфраструктуры ИИ в технологических экосистемах и приложениях, смежных с блокчейном.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

8 Лайков

Награда
8
5
Репост
Поделиться

комментарий

0/400

TokenToaster

· 14ч назад

Grok снова начал показывать силу, 31.2% доли токенов... эта цифра действительно безумная или benchmark снова начал играть в игры?

Посмотреть ОригиналОтветить0

StablecoinArbitrageur

· 14ч назад

Независимо от того, что 489 миллиардов токенов и 31,2% доминирование выглядят чисто на бумаге, кто-нибудь действительно проводил стресс-тестирование соотношения задержки и пропускной способности? Бенчмарки кода выглядят эффектно, но меня больше интересуют реальные показатели проскальзывания при масштабном развертывании.

Посмотреть ОригиналОтветить0

BlockchainWorker

· 15ч назад

grok эта волна действительно сильна, 489 миллиардов токенов прямо раздавили... Но честно говоря, в рейтингах тоже есть свои нюансы, главное всё-таки как это работает на практике.

Посмотреть ОригиналОтветить0

CascadingDipBuyer

· 15ч назад

grok эти данные действительно впечатляют, 489 миллиардов токенов напрямую превосходит, 31.2% рыночной доли? Эта разница немного преувеличена... но я действительно верю в лидирующие позиции в генерации кода, в области мультиязычности они действительно сильны

Посмотреть ОригиналОтветить0

DaisyUnicorn

· 15ч назад

489 миллиардов токенов, ого, это цветы распустились очень ярко... но рейтинг — это просто для удовольствия, главное, чтобы было интересно

Посмотреть ОригиналОтветить0