D’après la surveillance de 1M AI News, le laboratoire Tongyi d’Alibaba a publié un modèle unifié de génération et d’édition d’images, Wan2.7-Image, qui met en avant « Des humains plus vrais, des caractères plus stables, des couleurs plus justes ».
Le modèle prend en charge l’entrée directe de Hex Color Code pour définir une palette de couleurs ; la page récapitulative officielle indique qu’il peut contrôler les couleurs avec 8 Hexcode. Côté rendu du texte, il prend en charge la sortie de 4000 caractères anglais, ainsi que plusieurs langues comme le chinois simplifié, le chinois traditionnel, l’anglais, le japonais, le coréen, etc., avec un mélange de tableaux et de formules mathématiques.
La création continue est une autre priorité de cette mise à jour. Wan2.7-Image prend en charge la génération de jusqu’à 12 images en ensemble, ainsi que l’entrée d’au plus 9 images de référence, et peut être utilisée pour des storyboards, des affiches en série et la génération de cohérence des personnages. Côté édition, de nouvelles fonctionnalités ont été ajoutées : l’édition par sélection précise au cadre et la génération d’images PNG avec un canal entièrement transparent, permettant de séparer les éléments sélectionnés du fond. Les scénarios de mise en œuvre fournis par l’officiel incluent des images pour la mise en ligne e-commerce, des storyboards de mini-séries, des graphiques éducatifs, des albums jeunesse, des affiches et des conceptions d’invitations. Le site officiel et l’API ont été mis en ligne.