معاينة كلود ميثوس من أنثروبي غير المُعلنة حددت بشكل مستقل آلاف ثغرات اليوم-بلا-تصحيح عالية الخطورة عبر كل نظام تشغيل ومتصفح ويب رئيسي، ما دفع الشركة إلى إطلاق مشروع Glasswing، وهي ائتلافية دفاعية للأمن السيبراني مدعومة باعتمادات استخدام للذكاء الاصطناعي تصل إلى $100 مليون.
أبرز النقاط:
أنهى النموذج، الذي تصفه أنثروبي بأنه أكبر قفزة في القدرة عبر نموذج واحد في تاريخ الذكاء الاصطناعي في الخطوط الأمامية، التدريب وتم الإعلان عنه علنًا في 7 أبريل 2026، بعد أن ظهرت تفاصيل داخلية في أواخر مارس نتيجة سوء تهيئة في نظام إدارة محتوى كشف تقريبًا 3,000 ملف داخلي.
لن تطرح أنثروبي معاينة Claude Mythos للعامة أو عبر واجهتها العامة للبرمجة API. قيّدت الشركة الوصول على مجموعة محددة من الشركاء بعد أن أظهر النموذج أنه يمكنه اكتشاف واستغلال عيوب برمجية غير معروفة كانت تُكتشف سابقًا بوتيرة وحجم يفوق كليهما خبراء البشر والأنظمة السابقة للذكاء الاصطناعي.
في معايير الأمن السيبراني، فجوة gap بين Mythos وClaude Opus 4.6 يصعب تجاهلها. سجل Mythos 83.1% على Cybergym مقابل 66.6% لـ Opus 4.6، و93.9% مقابل 80.8% على SWE-bench Verified. وعلى SWE-bench Pro، نشر 77.8% مقابل 53.4% — أي فارق 24 نقطة. وحقق 56.8% على Humanity’s Last Exam دون أدوات، مقارنةً بـ 40.0% لسابقه.
لا يحتاج النموذج إلى تدريب مخصص للأمن السيبراني كي يعثر على هذه الأخطاء. تأتي مكاسبه من تطورات أوسع في الاستدلال والتخطيط متعدد الخطوات والسلوك الذاتي القائم على الوكلاء. مع وجود قاعدة شيفرة مستهدفة داخل حاوية معزولة، يقرأ الشيفرة المصدرية، ويصوغ فرضيات حول عيوب سلامة الذاكرة، ويقوم بترجمة وتشغيل البرمجيات، ويستخدم مصححات أخطاء مثل Address Sanitizer، ويرتب الملفات حسب احتمالية احتوائها على ثغرات، وينتج تقارير أخطاء مُتحققًا منها تتضمن إثبات مفهوم يعمل مع استغلال.
تطلبت بعض هذه الاستغلالات توجيهًا بشريًا قليلًا جدًا. تشير Tomshardware.com إلى أن ثغرة OpenBSD TCP SACK عمرها 27 عامًا — وهي تجاوز صحيح عددي دقيق يسمح للمهاجم بإسقاط أي مضيف يستجيب عن بُعد عبر صياغة حزم خبيثة — تم العثور عليها بشكل مستقل بعد نحو 1,000 تشغيل بتكلفة إجمالية أقل من $20,000. ونجت ثغرة FFmpeg H.264 التي عمرها 16 عامًا من أكثر من خمسة ملايين اختبار آلي ومراجعات متعددة قبل أن يلتقطها Mythos.
جذبت نتائج المتصفح اهتمامًا خاصًا. في اختبار محرك جافاسكربت على Firefox 147، أنتج Mythos 181 عملية استغلال كاملة لصدفة shell و29 حالة للتحكم بالسجلات. أنتج Claude Opus 4.6 استغلالين لصدفة shell ضمن مجموعة الاختبار نفسها. كما بنى النموذج سلاسل عمل لرفع امتيازات نواة Linux، من المستخدم إلى الجذر على الخوادم، بعد تصفية 100 CVE حديث إلى 40 مرشحًا قابلًا للاستغلال بنجاح، ثم استغل أكثر من نصفها بنجاح.
راجع الممتحنون البشر 198 من تقارير الثغرات الخاصة بالنموذج واتفقوا مع تقييماته لشدة الخطورة 89% من الوقت، مع اتفاق بنسبة 98% ضمن مستوى واحد من مستويات الشدة.
لم تتم حتى الآن معالجة أقل من 1% من الأخطاء المحددة بالكامل. تنسق أنثروبي الكشف المسؤول، وتنشر التزامات SHA-3 تشفيرية لقضايا غير مُعالجة، وتتبع جدولًا زمنيًا مدته 90 يومًا زائد 45 يومًا قبل نشر التفاصيل الكاملة. ثغرة تنفيذ شيفرة عن بُعد في خادم FreeBSD NFS، CVE-2026-4747، التي عمرها 17 عامًا، والتي تمنح وصولًا كاملاً للجذر دون مصادقة، من بين الأمثلة المذكورة ضمن ما تم الإفصاح عنه بالفعل.

مشروع Glasswing، الذي أُعلن عنه بالتزامن مع النموذج، هو محاولة أنثروبي لتوجيه هذه القدرات نحو الدفاع قبل أن تصبح أدوات مشابهة متاحة على نطاق واسع. تتضمن الشراكات المؤسِّسة Amazon Web Services وApple وBroadcom وCisco وCrowdstrike وGoogle وJPMorganChase وLinux Foundation وMicrosoft وNvidia وPalo Alto Networks. يتم توسيع الوصول ليشمل أكثر من 40 مؤسسة برمجيات حرجة إضافية.
تعهدت أنثروبي بمبلغ $4 مليون في تبرعات أمنية مفتوحة المصدر: 2.5 مليون دولار إلى Alpha-Omega عبر OpenSSF عبر Linux Foundation، و1.5 مليون دولار إلى مؤسسة Apache Software Foundation.
أقرت الشركة بأن أدوات الذكاء الاصطناعي مثل Mythos تُقلل حاجز العثور على الثغرات واستغلالها، وحددت خطورة قريبة المدى من الجهات الفاعلة المدعومة من الدول مثل الصين وإيران وكوريا الشمالية وروسيا، ومن الجماعات الإجرامية في حال انتشار قدرات مماثلة دون ضوابط. وصفت فترة من الاضطراب الانتقالي قبل أن يدمج المدافعون التكنولوجيا بالكامل.
قالت أنثروبي إن إصدارات Claude Opus القادمة ستتضمن إجراءات حماية لاكتشاف المخرجات الخطرة للأمن السيبراني وحظرها، وتخطط لإدخال برنامج التحقق السيبراني Cyber Verification Program للمحترفين الأمنيين الذين تم فحصهم. يُتوقع صدور تقرير عام عن نتائج الشركاء والثغرات التي تم إصلاحها خلال 90 يومًا.