لوما تطلق Uni-1، أول نموذج لها يدمج التفكير وتوليد الصور

robot
إنشاء الملخص قيد التقدم

باختصار

كشفت لُوما عن Uni-1، أول نموذج لها يجمع بين التفكير وتوليد الصور في بنية واحدة — في تحول كبير من جذور الشركة التي كانت تركز على الفيديو.

Luma Rolls Out Uni-1, Its First Model Integrating Reasoning And Image Generation

أطلقت شركة لُوما، المتخصصة في توليد الفيديو بواسطة الذكاء الاصطناعي، نموذج Uni-1، وهو أول نموذج يدمج التفكير وتوليد الصور ضمن بنية واحدة، مما يمثل تحولًا استراتيجيًا عن التركيز السابق على محتوى الفيديو.

ووفقًا للشركة، خلال السنوات الثلاث الماضية، تطور عمل لُوما من إعادة بناء المشاهد إلى توليد ثلاثي الأبعاد وتوسيع انتشار الفيديو، لكن الوسائط البصرية وحدها لها حدود بدون فهم متكامل. يُعتبر Uni-1 أول نموذج موحد من الشركة مصمم لدمج القدرات على التفكير والإنتاج، بهدف تعزيز الذكاء العام متعدد الوسائط.

تصف لُوما الذكاء العام بأنه القدرة على التفكير، والتخيل، والتلاعب بالرموز، ومحاكاة البيئات. بينما يمكن للأنظمة الحالية من الذكاء الاصطناعي أداء هذه الوظائف بشكل منفصل، يسعى Uni-1 لدمجها ضمن إطار واحد، مع نمذجة الزمن والمكان والمنطق معًا لتمكين حل المشكلات الذي لا يمكن أن تحققه خطوط الأنابيب التقليدية المنفصلة.

تم بناء النموذج كمحول تلقائي يعتمد على فك التشفير فقط، ويمثل النصوص والصور في تسلسل متداخل واحد يعمل كمدخلات ومخرجات على حد سواء. يستطيع Uni-1 أداء التفكير الداخلي المنظم، وتحليل التعليمات، وحل القيود، وتخطيط التكوين، وتوليد الصور وفقًا لذلك.

يُظهر Uni-1 القدرة على “التفكير باللغة والتخيل والتصيير بالبكسلات”، وهي قدرة تصفها لُوما بأنها “الذكاء في البكسلات”. من المتوقع أن تتوفر مخرجات إضافية، بما في ذلك توليد الصوت والفيديو، في الإصدارات اللاحقة. النموذج لا يُعتبر مجرد أداة، بل منصة تُغير طريقة عمل الشركات من خلال دمج التفكير مباشرة في سير العمل الإبداعي.

وكلاء لُوما يوسعون الذكاء الموحد

استنادًا إلى Uni-1، أطلقت لُوما مؤخرًا مجموعة وكلاء لُوما، وهي أدوات تعتمد على الذكاء الاصطناعي مصممة لإدارة الإنتاج الإبداعي من البداية إلى النهاية عبر النص، والصورة، والفيديو، والصوت. تعمل الوكلاء باستخدام عائلة نماذج لُوما للذكاء الموحد، التي تم تدريبها على نظام تفكير متعدد الوسائط واحد. تضع لُوما الوكلاء كحل لوكالات الإعلان، وفرق التسويق، واستوديوهات التصميم، والعملاء المؤسساتيين، لتوفير توليد إبداعي منسق عبر وسائط متعددة.

تتوافق وكلاء لُوما مع نماذج ذكاء اصطناعي أخرى، بما في ذلك Ray 3.14 من لُوما، وVeo 3 وNano Banana Pro من جوجل، وSeedream من ByteDance، وأدوات توليد الصوت من ElevenLabs. ووفقًا لأميت جاين، الرئيس التنفيذي والمؤسس المشارك لشركة لُوما، فإن الوكلاء يستفيدون من بنية Uni-1 المتكاملة، التي تم تدريبها على الصوت، والفيديو، والصورة، واللغة، والمنطق المكاني، مما يسمح لهم بالتخطيط والتنفيذ وتوليد المحتوى في سير عمل منسق وذكي.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.41Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.46Kعدد الحائزين:2
    0.23%
  • تثبيت