أصدرت هيئة معهد أمن الذكاء الاصطناعي في المملكة المتحدة (AI Security Institute, AISI) في 1 مايو تقريرًا لتقييم قدرات الهجمات السيبرانية لطراز OpenAI GPT-5.5. ويبلغ معدل نجاح GPT-5.5 في اختبارات مستوى Expert نسبة 71.4%، بينما تبلغ نسبة Anthropic Claude Mythos Preview 68.6%، مع بقاء الفارق ضمن نطاق الخطأ الإحصائي. كما يُعد GPT-5.5 ثاني نظام ذكاء اصطناعي بعد Mythos ينجز بشكل مستقل خطة AISI المؤلفة من 32 خطوة بعنوان «The Last Ones»، والتي تحاكي بالكامل اختراق شبكات الشركات. حذّرت AISI من أن هذا يبيّن أن التقدم السريع في قدرات هجوم الذكاء الاصطناعي قد يكون جزءًا من «اتجاه عام» وليس حدث اختراق منفرد.
اختبار مستوى Expert: 71.4% مقابل 68.6%، والفارق ضمن نطاق الخطأ
تُعد AISI جهة بحثية مختصة بأمن الذكاء الاصطناعي تابعة لوزارة العلوم والابتكار والتقنية في المملكة المتحدة. وتُعد هذه الجولة أحدث تقييم تنفذه AISI لقدرات الشبكات الهجومية لموديلات الذكاء الاصطناعي المتقدمة. في أعلى مستوى من أسئلة Expert، بلغ متوسط معدل نجاح GPT-5.5 نسبة 71.4%، مقابل 68.6% لدى Mythos Preview؛ ويقع الفارق بينهما ضمن نطاق الخطأ الإحصائي، ما يعني أن قدرات النماذج الرائدة لدى OpenAI وAnthropic في الهجمات السيبرانية متقاربة فعليًا حتى الآن.
تُعد تجربة اختراق شبكات الشركات المحاكاة المكونة من 32 خطوة بعنوان «The Last Ones» من أكثر بنود تقييم AISI تحديًا: نجح GPT-5.5 في إتمام المهمة مرتين بشكل مستقل من 10 محاولات (دون تدخل بشري)، بينما تمكن Mythos Preview من إتمامها 3 مرات من أصل 10. كانت هذه المهمة تُنجز سابقًا عبر Mythos فقط، ويُعد GPT-5.5 ثاني نموذج يحقق المستوى المطلوب. وفي اختبار آخر، نجح GPT-5.5 في حل مسألة هندسة عكسية خلال نحو 10 دقائق، بينما يحتاج خبراء أمان بشر بمتوسط 12 ساعة.
jailbreak عالمي: 6 ساعات لتطوير فريق أحمر بما يكفي للتحايل على جميع فلاتر الاستعلامات الخبيثة
كما رصد باحثون في AISI في الاختبارات «ناقل هجوم universal jailbreak» (jailbreak عالمي). ففي فئات الاستعلامات الشبكية الخبيثة التي تم اختبارها، يستطيع هذا الهجوم إقناع GPT-5.5 بإخراج محتوى ضار، بما يشمل سيناريوهات حوار متعددة الجولات تعتمد على وكلاء (agentic). وتقول AISI إن خبراء فريق أحمر طوّروا هذا jailbreak خلال نحو 6 ساعات.
وبالنسبة إلى OpenAI، فإن وجود universal jailbreak يعني أنه حتى إذا تم نشر GPT-5.5-Cyber في سيناريوهات مقيدة مثل برنامج الوصول الموثوق (trusted access)، فقد يتم التحايل عليه من قبل خصوم ذوي مهارات تقنية عالية. وقد كشفت OpenAI في «بطاقة نظام» GPT-5.5 عن تقييمات مرتبطة بالأمن السيبراني، لكن تقييم AISI المستقل من طرف ثالث يقدم معيارًا نظيرًا ذا مصداقية أكبر.
المتابعات المقبلة: جدول تقييم AISI التالي، وكيف ستتجه OpenAI للتعامل مع jailbreak
نقطة المراقبة التالية تتمثل في جدول تقييم AISI للجولة التالية من نماذج الذكاء الاصطناعي المتقدمة بعد Mythos وGPT-5.5، وكذلك ما إذا كانت OpenAI ستصدر تحديثات موجهة في مايو للتعامل مع universal jailbreak الذي تم الكشف عنه في هذه المرة. وقد أوضحت AISI في خاتمة تقريرها بشكل صريح: «إذا كانت قدرات الهجوم السيبراني هي نتاج ثانوي لتحسينات أوسع في الاستدلال والترميز والتفويض الذاتي، فقد تأتي التقدمات اللاحقة بوتيرة أسرع». ويعني هذا الرصد أن النماذج المتقدمة قد تدخل خلال الأشهر المقبلة «حد Mythos» مرة أخرى.
ظهرت هذه المقالة تقييم AISI: قدرات هجوم GPT-5.5 السيبراني متطابقة مع Anthropic Mythos لأول مرة على موقع سلسلة الأخبار ABMedia.
مقالات ذات صلة
حظر ولاية مينيسوتا أدوات الذكاء الاصطناعي لإنشاء صور حميمة غير رضائية، مع فرض غرامات قد تصل إلى $500K
مستخدمو ChatGPT يمكنهم الآن الوصول إلى الاشتراكات على منصة OpenClaw، سام ألتمان يعلن
يطلق xAI أصوات Grok المخصصة، ويتيح للمستخدمين نسخ أصواتهم الصوتية الخاصة بالذكاء الاصطناعي خلال دقيقة واحدة
بعد HBM، فإن اختناق ذاكرة الذكاء الاصطناعي هو HBF؟ الحائز على جائزة تورينغ ديفيد باترسون: سيُعيد الاستدلال تعريف بنية التخزين
مؤتمر مطوّري الشفرة لدى Anthropic مع Claude، افتتاح 6/5 في سان فرانسيسكو: بث مباشر وتسجيل مجاني
أعلنت OpenAI بيانات أسبوع الإطلاق لـ GPT-5.5: نمو إيرادات واجهة برمجة التطبيقات بلغ مستوى قياسياً جديداً، وارتفع Codex إلى الضعف