Avaliação independente mostra que o MiniMax M2.7 é comparável aos modelos de ponta de código fechado em tarefas centrais de inteligência.

robot
Geração de resumo em curso

ME News Notícias, 5 de abril (UTC+8), recentemente, de acordo com uma avaliação independente do LangChain, o modelo de peso aberto MiniMax M2.7 atingiu um nível comparável ao de modelos de ponta de código fechado em tarefas centrais de agentes inteligentes, como operações de ficheiros, chamadas de ferramentas e seguimento de instruções. A opinião no artigo afirma que sua vantagem reside na redução de custos em aproximadamente 20 vezes e no aumento de velocidade de 2 a 4 vezes. Tomando como exemplo uma saída diária de 10 milhões de tokens, o custo com Opus 4.6 é de cerca de 250 dólares por dia, enquanto o MiniMax M2.7 custa apenas cerca de 12 dólares por dia. Este avanço deve-se ao impulso de benchmarks abertos como SWE-Rebench e Terminal Bench 2.0, tornando os modelos abertos uma opção viável para implantação de agentes inteligentes em ambientes de produção, podendo também ser utilizados em conjunto com modelos de código fechado. (Fonte: InFoQ)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar