🔥Ali PAI AgenticQwen open source agenticQwen: double data flywheel training, 8B performance close to 235B


L'équipe Ali PAI a publié et open source la série de modèles AgenticQwen (8B, 30B-A3B), conçus pour l'utilisation d'outils industriels. Grâce au cadre d'apprentissage par renforcement « double data flywheel », le modèle obtient en moyenne 47,4 points sur les benchmarks TAU-2 et BFCL-V4 pour la version 8B, proche de 52,0 pour Qwen3-235B, et 50,2 pour la version 30B-A3B. Ce modèle a été déployé dans des systèmes de production internes, mais en raison d'une longueur de contexte limitée à 40K, les tâches de recherche approfondie restent limitées.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler