Según el monitoreo de 1M AI News, el laboratorio de Tongyi de Alibaba lanzó el modelo unificado para generación y edición de imágenes Wan2.7-Image, con el lema de que es “más real, el texto más estable y los colores más precisos”.
El modelo admite la entrada directa de Hex Color Code para definir paletas; la página de resumen oficial afirma que se pueden usar 8 Hexcode para controlar los colores. En el renderizado de texto, admite la salida de 4000 caracteres en inglés, y también admite múltiples idiomas como chino simplificado, chino tradicional, inglés, japonés y coreano, además de permitir la mezcla de tablas y fórmulas matemáticas.
La creación continua es otro punto destacado de esta actualización. Wan2.7-Image admite la generación de hasta 12 imágenes en un conjunto, y hasta 9 imágenes de referencia como entrada, que pueden usarse para storyboards, pósters de una serie y generación manteniendo la coherencia del personaje. En el lado de edición se añadieron la edición con selección precisa por marco y la generación de PNG con canal de fondo totalmente transparente, lo que permite separar los elementos seleccionados del fondo. Los escenarios de implementación proporcionados por la compañía incluyen imágenes para listados de comercio electrónico, storyboards de cortometrajes, gráficos educativos, libros ilustrados para niños, diseño de pósters e invitaciones. El sitio web y la API ya están en línea.