في عام 2025، ثلاث دروس تعلمتها من مجال الروبوتات @DrJimFan



1⃣️ الأجهزة تسبق البرمجيات، لكن موثوقية الأجهزة تقيد بشكل كبير سرعة تكرار البرمجيات لقد رأينا بالفعل روائع هندسية دقيقة للغاية: Optimus، e-Atlas، Figure، Neo، G1 وغيرها. لكن المشكلة هي أن أفضل ذكائنا الاصطناعي لم يستغل بعد كامل إمكانيات هذه الأجهزة المتطورة. قدرات جسم الروبوت، واضحة أنها تتفوق على الأوامر التي يصدرها الدماغ حاليًا. ومع ذلك، فإن "خدمة" هذه الروبوتات غالبًا تتطلب فريق عمليات كامل. الروبوتات لا تصلح ذاتيًا مثل البشر: ارتفاع الحرارة، تلف المحركات، مشكلات غريبة في الفيرم وير، كلها كوابيس يومية تقريبًا. بمجرد حدوث خطأ، يكون غير قابل للتراجع، ولا يتسامح معه. الشيء الوحيد الذي يتوسع حقًا هو صبري.

2⃣️ الاختبارات المرجعية في مجال الروبوتات لا تزال كارثة أسطورية في عالم النماذج الكبيرة، الجميع يعرف ما هو MMLU وSWE-Bench. لكن لا يوجد توافق في الرأي في مجال الروبوتات: على أي منصة أجهزة، كيف يتم تعريف المهام، ما هي معايير التقييم، هل نستخدم محاكيات أم ننتقل مباشرة إلى العالم الحقيقي؟ حسب التعريف، كل شخص يعتبر SOTA — لأنه في كل مرة يصدر فيها خبر، يحدد معيارًا جديدًا مؤقتًا. كل شخص يختار من بين 100 فشل، أفضل عرض توضيحي. بحلول عام 2026، يجب أن نكون قد أدركنا أن نكون أفضل، وأن لا نعامل القابلية لإعادة الإنتاج والمعايير العلمية كمواطنين من الدرجة الثانية.

3⃣️ مسار VLA المستند إلى VLM، يبدو أن هناك شيئًا غير صحيح على الإطلاق. VLA تشير إلى نموذج الرؤية-اللغة-الإجراء (Vision-Language-Action)، وهو الآن النموذج السائد لعقول الروبوتات. الوصفة بسيطة جدًا: تأخذ نقطة تفتيش VLM مدربة مسبقًا، وتقوم بـ"تركيب" وحدة إجراء عليه. لكن عند التفكير مليًا، ستكتشف المشكلة. في جوهرها، VLM مصممة بشكل مكثف لتسلق معايير مثل الأسئلة والأجوبة البصرية، مما يؤدي إلى نتيجتين: معظم معلمات VLM تخدم اللغة والمعرفة، وليس العالم الفيزيائي؛ المشفر البصري يُدرّب بنشاط على التخلي عن التفاصيل الدقيقة، لأن مهمة الأسئلة والأجوبة تتطلب فهمًا عالي المستوى، لكن بالنسبة للروبوت، التفاصيل الدقيقة ضرورية للعمليات الدقيقة. لذلك، أداء VLA لا يتوقع أن يتزايد بشكل خطي مع حجم معلمات VLM. المشكلة أن هدف التدريب المسبق غير متوافق أصلاً. #AI #Robtics
شاهد النسخة الأصلية
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$3.57Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$3.54Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.53Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.54Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$4.48Kعدد الحائزين:63
    0.29%
  • تثبيت