06:30
Zhizi Engine lanza el modelo multimodal grande "Meta Multiplication Chatimg 3.0"
Zhizi Engine lanzó el modelo multimodal grande "Meta Multiplication Elephant Chatimg 3.0", que admite la comprensión de múltiples imágenes, el posicionamiento de objetos, OCR y otras funciones. Según los informes, en comparación con Chatimg2.0, Chatimg3.0 se ha actualizado en dos aspectos principales, incluida la primera etapa de entrenamiento previo (descripción, detección, OCR y otro entrenamiento multitarea) y la segunda etapa de ajuste fino de la instrucción (conjunto de instrucciones de detección fina artificial de alta calidad).
- 1
- 1

