تقييم AISI: قدرات GPT-5.5 في شن الهجمات عبر الإنترنت تتعادل مع قدرات Anthropic Mythos

ChainNewsAbmedia

أصدرت هيئة معهد أمن الذكاء الاصطناعي في المملكة المتحدة (AI Security Institute, AISI) في 1 مايو تقريرًا لتقييم قدرات الهجمات السيبرانية لطراز OpenAI GPT-5.5. ويبلغ معدل نجاح GPT-5.5 في اختبارات مستوى Expert نسبة 71.4%، بينما تبلغ نسبة Anthropic Claude Mythos Preview 68.6%، مع بقاء الفارق ضمن نطاق الخطأ الإحصائي. كما يُعد GPT-5.5 ثاني نظام ذكاء اصطناعي بعد Mythos ينجز بشكل مستقل خطة AISI المؤلفة من 32 خطوة بعنوان «The Last Ones»، والتي تحاكي بالكامل اختراق شبكات الشركات. حذّرت AISI من أن هذا يبيّن أن التقدم السريع في قدرات هجوم الذكاء الاصطناعي قد يكون جزءًا من «اتجاه عام» وليس حدث اختراق منفرد.

اختبار مستوى Expert: 71.4% مقابل 68.6%، والفارق ضمن نطاق الخطأ

تُعد AISI جهة بحثية مختصة بأمن الذكاء الاصطناعي تابعة لوزارة العلوم والابتكار والتقنية في المملكة المتحدة. وتُعد هذه الجولة أحدث تقييم تنفذه AISI لقدرات الشبكات الهجومية لموديلات الذكاء الاصطناعي المتقدمة. في أعلى مستوى من أسئلة Expert، بلغ متوسط معدل نجاح GPT-5.5 نسبة 71.4%، مقابل 68.6% لدى Mythos Preview؛ ويقع الفارق بينهما ضمن نطاق الخطأ الإحصائي، ما يعني أن قدرات النماذج الرائدة لدى OpenAI وAnthropic في الهجمات السيبرانية متقاربة فعليًا حتى الآن.

تُعد تجربة اختراق شبكات الشركات المحاكاة المكونة من 32 خطوة بعنوان «The Last Ones» من أكثر بنود تقييم AISI تحديًا: نجح GPT-5.5 في إتمام المهمة مرتين بشكل مستقل من 10 محاولات (دون تدخل بشري)، بينما تمكن Mythos Preview من إتمامها 3 مرات من أصل 10. كانت هذه المهمة تُنجز سابقًا عبر Mythos فقط، ويُعد GPT-5.5 ثاني نموذج يحقق المستوى المطلوب. وفي اختبار آخر، نجح GPT-5.5 في حل مسألة هندسة عكسية خلال نحو 10 دقائق، بينما يحتاج خبراء أمان بشر بمتوسط 12 ساعة.

jailbreak عالمي: 6 ساعات لتطوير فريق أحمر بما يكفي للتحايل على جميع فلاتر الاستعلامات الخبيثة

كما رصد باحثون في AISI في الاختبارات «ناقل هجوم universal jailbreak» (jailbreak عالمي). ففي فئات الاستعلامات الشبكية الخبيثة التي تم اختبارها، يستطيع هذا الهجوم إقناع GPT-5.5 بإخراج محتوى ضار، بما يشمل سيناريوهات حوار متعددة الجولات تعتمد على وكلاء (agentic). وتقول AISI إن خبراء فريق أحمر طوّروا هذا jailbreak خلال نحو 6 ساعات.

وبالنسبة إلى OpenAI، فإن وجود universal jailbreak يعني أنه حتى إذا تم نشر GPT-5.5-Cyber في سيناريوهات مقيدة مثل برنامج الوصول الموثوق (trusted access)، فقد يتم التحايل عليه من قبل خصوم ذوي مهارات تقنية عالية. وقد كشفت OpenAI في «بطاقة نظام» GPT-5.5 عن تقييمات مرتبطة بالأمن السيبراني، لكن تقييم AISI المستقل من طرف ثالث يقدم معيارًا نظيرًا ذا مصداقية أكبر.

المتابعات المقبلة: جدول تقييم AISI التالي، وكيف ستتجه OpenAI للتعامل مع jailbreak

نقطة المراقبة التالية تتمثل في جدول تقييم AISI للجولة التالية من نماذج الذكاء الاصطناعي المتقدمة بعد Mythos وGPT-5.5، وكذلك ما إذا كانت OpenAI ستصدر تحديثات موجهة في مايو للتعامل مع universal jailbreak الذي تم الكشف عنه في هذه المرة. وقد أوضحت AISI في خاتمة تقريرها بشكل صريح: «إذا كانت قدرات الهجوم السيبراني هي نتاج ثانوي لتحسينات أوسع في الاستدلال والترميز والتفويض الذاتي، فقد تأتي التقدمات اللاحقة بوتيرة أسرع». ويعني هذا الرصد أن النماذج المتقدمة قد تدخل خلال الأشهر المقبلة «حد Mythos» مرة أخرى.

ظهرت هذه المقالة تقييم AISI: قدرات هجوم GPT-5.5 السيبراني متطابقة مع Anthropic Mythos لأول مرة على موقع سلسلة الأخبار ABMedia.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

حظر ولاية مينيسوتا أدوات الذكاء الاصطناعي لإنشاء صور حميمة غير رضائية، مع فرض غرامات قد تصل إلى $500K

وفقاً لـ Decrypt، أقرّت الهيئة التشريعية في ولاية مينيسوتا مشروع قانون في 2 مايو يحظر على مواقع الويب والتطبيقات تقديم أدوات ذكاء اصطناعي تُنشئ صوراً حميمة غير توافقية لأفراد يمكن التعرّف عليهم. ويمنع القانون المنصات من السماح للمستخدمين بالوصول إلى أدوات «الديب فيك» هذه أو استخدامها، ويحظر أيضاً

GateNewsمنذ 23 د

مستخدمو ChatGPT يمكنهم الآن الوصول إلى الاشتراكات على منصة OpenClaw، سام ألتمان يعلن

بحسب إعلان سام ألتمان اليوم، يمكن لمستخدمي ChatGPT الآن تسجيل الدخول إلى منصة وكيل OpenClaw باستخدام حسابات ChatGPT الخاصة بهم والوصول مباشرةً إلى اشتراكات ChatGPT الحالية لديهم على المنصة.

GateNewsمنذ 1 س

يطلق xAI أصوات Grok المخصصة، ويتيح للمستخدمين نسخ أصواتهم الصوتية الخاصة بالذكاء الاصطناعي خلال دقيقة واحدة

وفقاً لبيتينغ، أطلقت xAI ميزات Grok Custom Voices وVoice Library، ما يتيح للمستخدمين تسجيل دقيقة واحدة من الصوت في وحدة تحكم xAI لإنشاء معرّف voice_id مخصّص لاستخدامه مع واجهات برمجة تطبيقات Grok TTS وVoice Agent. تدعم الميزة تطبيقات تتضمن وكلاء خدمة العملاء، وإنتاج المحتوى،

GateNewsمنذ 2 س

بعد HBM، فإن اختناق ذاكرة الذكاء الاصطناعي هو HBF؟ الحائز على جائزة تورينغ ديفيد باترسون: سيُعيد الاستدلال تعريف بنية التخزين

وأشار الحائز على جائزة تورينغ ديفيد باترسون إلى أنه مع انتقال الذكاء الاصطناعي من التدريب إلى الاستدلال على نطاق واسع، قد لا يكون عنق الزجاجة التالي هو HBM، بل HBF (ذاكرة فلاش عالية عرض النطاق الترددي وسريعة). توفر HBF تكديس NAND Flash بحجم كبير واستهلاك طاقة منخفض، وتُعنى بالوصول إلى السياق والبيانات الوسيطة في الاستدلال، وهو ما يختلف عن التقسيم مع HBM الذي يركز على السرعة. وتعمل SK Hynix وSanDisk على دفع عملية توحيد المعايير، ومن المتوقع أن تتجاوز متطلبات HBF بحلول 2038 متطلبات HBM.

ChainNewsAbmediaمنذ 2 س

مؤتمر مطوّري الشفرة لدى Anthropic مع Claude، افتتاح 6/5 في سان فرانسيسكو: بث مباشر وتسجيل مجاني

أعلنت Anthropic في 1 مايو أن أول مؤتمر «Code with Claude» للمطوّرين سيُفتتح في 6 مايو في سان فرانسيسكو، على أن يتم توسيعه لأول مرة ليشمل جولات في ثلاث مدن: لندن (19/5) وطوكيو (10/6). أما المقاعد المخصصة للاجتماعات الرئيسية في كل مدينة فتُمنح عبر القرعة وقد تم الانتهاء من اختيار الفائزين فيها، لكن التسجيل للبث المباشر ما زال متاحاً للجميع. وباستجابةً لطلبات الحضور في سان فرانسيسكو التي فاقت الطاقة الاستيعابية، سيتم إضافة جلسة «Extended» في 7/5، صُممت خصيصاً للمطوّرين المستقلين والمؤسسين في المراحل المبكرة. الجولات الثلاث: 6/5 سان فرانسيسكو، 19/5 لندن، 10/6 طوكيو يُعد «Code with Claude» مؤتمراً للمطوّرين تنظمه Anthropic، وقد شهدت نسخة سان فرانسيسكو الرئيسية إقامتها للمرة الثانية. وتتضمن الفعاليات الثلاث محتوىً متشابهاً: ورش عمل حضورية ليوم كامل، عروضاً توضيحية للميزات الأحدث، وClaude على كل جهة

ChainNewsAbmediaمنذ 3 س

أعلنت OpenAI بيانات أسبوع الإطلاق لـ GPT-5.5: نمو إيرادات واجهة برمجة التطبيقات بلغ مستوى قياسياً جديداً، وارتفع Codex إلى الضعف

أعلنت OpenAI في 1 مايو عبر حسابها الرسمي 3 بيانات بعد مرور أسبوع على إطلاق GPT-5.5: تقييم ذاتي بأنه «أقوى طرح على الإطلاق»، وأن وتيرة نمو إيرادات واجهة برمجة التطبيقات تفوق بأكثر من الضعف أي مرة سابقة لإطلاق نموذج، وأن Codex ضاعف إيراداته خلال أقل من 7 أيام. تُعزِي OpenAI السبب إلى تزايد متطلبات جهة الشركات باستمرار على أدوات agentic coding (الترميز الوكيل)، واعتبرت أن هذا يتزامن مع إيقاع منتجات واحد بالتنافس مع Anthropic Mythos في نفس فترة GPT-5.5-Cyber الصادرة في 30 أبريل. 3 بيانات من بين ما نُشر: تسارع نمو إيرادات واجهة برمجة التطبيقات، مضاعفة Codex خلال 7 أيام، وأقوى طرح ترجع الأرقام الثلاثة المحورية التي أعلنتها OpenAI إلى تغريدات رسمية، دون إرفاق بيانات مالية تفصيلية: أولاً، إن GPT-5.5 هو «الأقوى في نمو الإيرادات عبر تاريخها»، والجزء …

ChainNewsAbmediaمنذ 3 س
تعليق
0/400
لا توجد تعليقات