ترقية كبيرة لـ Google Gemini 3 Deep Think: قدرة الاستنتاج تتفوق على Opus 4.6 و GPT-5.2، بهدف أن يكون "أكثر ذكاء اصطناعي يبحث عن العلم"

BTC‎-0.46%

أصدرت جوجل تحديثا كبيرا لبرنامج Gemini 3 Deep Think، متجاوزة بشكل كبير كلود أوبوس 4.6 (68.8٪) وGPT-5.2 (52.9٪) في اختبار ARC-AGI-2 بنسبة 84.6٪، مع تحقيق تصنيف “السيد الكبير الأسطوري” في Codeforces.
(الملخص: تم تقديم نموذج التعلم في ChatGPT: هل هو غروب الدروس الخصوصية، أم فجر العصر الذهبي للتعليم؟ )
(ملحق خلفي: أطلقت جوجل رسميا “جيميني 3”!) ما هي أبرز إنجازات الوصول إلى قمة أذكى نموذج ذكاء اصطناعي في العالم؟ )

جدول محتويات هذا المقال

  • ليس فقط الامتحانات، بل أيضا اكتشاف الأخطاء البشرية
  • التغيرات القشرية في حصة السوق
  • تأثير تموجي على صناعة العملات الرقمية
  • العلم بدأ للتو

أصدرت جوجل اليوم (الثالث عشر) ترقية كبيرة لجيميني 3 ديب ثينك. في اختبار ARC-AGI-2 (وهو اختبار استدلالي مخصص لمنع الذكاء الاصطناعي من حفظ بنوك الأسئلة، ولا يختبر مدى معرفتك، وما إذا كان بإمكانك تلخيص القواعد بنفسك من عدة أمثلة)، حصل اختبار Gemini 3 Deep Think على نسبة 84.6٪.

للمعلومية، حصل Claude Opus 4.6 (وضع التفكير الأكسي) على 68.8٪، وGPT-5.2 (وضع التفكير xhigh) على 52.9٪، ومتوسط الدرجة البشرية حوالي 60٪.

وما هو أكثر إثارة للدهشة هو أنه في اختبار ARC-AGI-1 الأصلي، حصلت Deep Think على 96٪، مما دفع هذا المعيار، الذي كان يعتبر سابقا “أحد أصعب الاختبارات في الذكاء الاصطناعي”، إلى أقصى حد.

Deep Think متاح حاليا لمشتركي Google AI Ultra، وواجهة برمجة التطبيقات مفتوحة للمؤسسات في مرحلة الوصول المبكر.

ليس فقط الامتحانات، بل أيضا أخطاء بشرية

بالإضافة إلى النتائج المستمرة، ذكرت جوجل تفصيلا في الإعلان: نجح Deep Think في تحديد ثغرة منطقية لم يكتشفها أي من المراجعين سابقا عند مراجعة ورقة رياضية تمت مراجعتها من قبل البشر. تم تأكيد هذه الورقة من قبل علماء الرياضيات في جامعة روتجرز.

تكمن أهمية هذه الحالة ليس في أداء النموذج في الاختبارات الموحدة، بل في قدرته على إثبات النتائج في سيناريوهات علمية حقيقية ومفتوحة النهاية. المراجعة من الأقران هي آلية التحكم الأساسية في الجودة في الأوساط الأكاديمية، وإذا تمكن الذكاء الاصطناعي من تقديم مساعدة قيمة باستمرار في هذه العملية، فإن تأثيره التسريع على البحث العلمي سيكون أبعد بكثير مما يمكن قياسه بأي معيار.

كما حقق ديب ثينك مستوى الميدالية الذهبية في قسم الاختبار التحريري من أولمبياد الفيزياء والكيمياء الدولي لعام 2025، بدرجة إيلو 3,455 في كودفورس، وهو ما يعادل مستوى “المعلم الكبير الأسطوري”، وهو عدد قليل فقط من المبرمجين البشر في العالم يمكنهم الوصول إلى هذا المستوى.

في “الامتحان الأخير للبشرية”، وهو معيار صممه خبراء في مجالات مختلفة وجعل الذكاء الاصطناعي متعمدا صعبا على الإجابة، حصل Deep Think على 48.4٪ (دون استخدام الأدوات)، محققا رقما قياسيا جديدا أيضا.

التغيرات القشرية في حصة السوق

السباق التقني في الثلاثي الكبار للذكاء الاصطناعي يغير مشهد السوق. انخفضت حصة ChatGPT السوقية من 87٪ في ذروتها إلى حوالي 68٪، بينما ارتفعت Gemini من أقل من 5٪ إلى أكثر من 18٪، وقامت شركة Anthropic بتآكل سوق المؤسسات بشكل مستمر.

الميزة الفريدة لجوجل في هذا السباق هي قدرتها على التوزيع. جيميني مدمج في أندرويد، ومتصفح كروم، وجوجل وورك بيس، ومحركات البحث، مما يعني أنه حتى لو كان متساويا مع منافسيه من حيث قدرات النماذج، يمكن لجوجل كسب المستخدمين من خلال مزايا القنوات.

لكن ميزة التوزيع هي سيف ذو حدين. إذا لم تكن تجربة Gemini جيدة بما فيه الكفاية، فقد تفقد ثقة المستخدمين أسرع من أي منافس لأن المستخدمين “يتفاعلون بشكل سلبي” بدلا من “اختيار نشط”. مستخدمو OpenAI يدفعون بنشاط ولديهم تحمل وثبات أعلى بطبيعتهم.

تأثير متتابع على صناعة العملات الرقمية

كل ترقية في سباق الذكاء الاصطناعي تدفع الطلب على البنية التحتية للحوسبة. تكلفة عناقيد وحدات معالجة الرسوميات المطلوبة لتدريب نموذج متقدم ارتفعت بشكل كبير من مئات الملايين من الدولارات في عام 2024 إلى مليارات الدولارات في عام 2026. وهذا يؤثر أيضا بشكل مباشر على أمرين.

**أولا، مسار التحول لمعدني البيتكوين.**عندما يتم ضغط أرباح التعدين (تقدر شركة JPMorgan Chase & Co. أن تكاليف إنتاج البيتكوين انخفضت إلى 7.7 مليون دولار هذا الأسبوع، بينما يبلغ سعر العملة حوالي 6.6 مليون)، فإن عمال المناجم الذين يمتلكون بنية تحتية حوسبة واسعة النطاق يسرعون تحولهم نحو خدمات الحوسبة بالذكاء الاصطناعي.

شركات التعدين عالية التكلفة لا “تخرج” بل “تغير مسارها المهني”، من تعدين البيتكوين إلى دخل العقود الذي يوفر قوة حوسبة بالذكاء الاصطناعي.

**ثانيا، سرد رموز الذكاء الاصطناعي.**كلما أصدرت جوجل أو OpenAI أو Anthropic ترقية كبيرة، عادة ما تتعرض الرموز المرتبطة بالذكاء الاصطناعي ضمن السلسلة مثل بروتوكولات الحوسبة اللامركزية لضجة قصيرة الأمد.

لكن المشكلة الأساسية لهذه الرموز لم تتغير: الحوسبة اللامركزية لا تزال بعيدة جدا عن الطلب على تدريب الذكاء الاصطناعي على مستوى المؤسسات من حيث التأخير وسرعة النقل. يمكن أن تسير السردية بسرعة، لكن البنية التحتية لا تستطيع مواكبة سرعة السرد.

فاصل التعادل العلمي بدأ للتو

الترقية إلى التفكير العميق تدفع جوجل إلى الصدارة في سباق الذكاء الاصطناعي، على الأقل في مجالي التفكير والعلم. لكن إذا نظرت عن كثب إلى صياغة إعلان جوجل، ستلاحظ تحولا طفيفا في التمركز: فبدلا من التركيز على “أذكى ذكاء اصطناعي عام الاستخدام”، يكرر المنشور “مصمم للعلم”.

مع ازدحام معايير الذكاء الاصطناعي العامة وصعوبة التمييز، فإن عبارة “ذكائي الاصطناعي يمكنه مساعدتك في إجراء أبحاث علمية” هي عرض قيمة أكثر إقناعا من “ذكائي الاصطناعي لديه أعلى درجة في التمرير.” إذا كان التفكير العميق قادرا حقا على المساعدة بشكل موثوق في مراجعة الأقران، وتسريع اكتشاف الأدوية، أو إيجاد حلول يغفلها البشر في محاكاة الفيزياء، فسيكون ذلك أكثر منطقية من أي قائمة مرجعية.

المشكلة أن المسافة بين “يمكن الحصول على درجات عالية في المعايير” إلى “يمكنها مساعدة البشر بشكل موثوق في السيناريوهات العلمية الحقيقية” قد تكون أبعد مما تقترحه جوجل، فبعد كل شيء، المعايير لها إجابات قياسية، أما العلم فلا يملكها.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

الرئيس التنفيذي لبلاك روك: توكنة جميع الأصول قد بدأت للتو

تحتوي المحافظ الرقمية العالمية على 4.1 تريليون دولار، منها كمية كبيرة خارج الولايات المتحدة. حكم فينك هو: تحويل صناديق المؤشرات المتداولة (ETF) إلى رموز رقمية، وتوجيه المستثمرين المبتدئين الذين يدخلون السوق عبر العملات المشفرة إلى منتجات التقاعد التقليدية، من العقارات إلى الأسهم إلى السندات، كلها رموز رقمية، وهو الفرصة الأساسية لبيركليد في العقود القادمة. حاليًا، تمتلك بيركليد أكبر صندوق سوق نقدي رمزي في العالم، BUIDL، ومنتج ETF الخاص بالبيتكوين iBIT يتجاوز حجمه 100 مليار دولار، بعد أن كان صفرًا قبل عامين. كان فينك، الذي كان يتردد سابقًا بشأن العملات المشفرة، يصرح الآن علنًا: أنا الآن أحبها، لكنني كنت دائمًا في حالة نمو وتعلم.

PANewsمنذ 2 د

غولدمان ساكس يحذر: هناك زخم "انتعاش حاد" في الأسهم الأمريكية، وتفجير مراكز البيع على المكشوف يدفع سوق التصحيح للأعلى

أشار جولدمان ساكس إلى أن صناديق التحوط حاليًا تحافظ على موقفها الصاعد في سوق الأسهم الأمريكية، مع بناء مراكز بيع كبيرة من خلال صناديق المؤشرات والعقود الآجلة للمؤشرات، مما يشكل زخمًا محتملًا لتغطية المراكز القصيرة. إذا ظهرت أخبار إيجابية، قد يتعافى السوق بسرعة. ولكن في الوقت نفسه، فإن انخفاض السيولة السوقية وارتفاع مستوى عدم اليقين قد يزيدان من تقلبات السوق.

ChainNewsAbmediaمنذ 17 د

وول ستريت تسرع في وضع التوقعات السوقية: صناديق التحوط تتنافس على دخول Kalshi، وقد تتدفق الأموال المؤسسية بكميات كبيرة

مع تطور سوق التوقعات، تدفع العديد من الوسطاء الرئيسيين في الولايات المتحدة بتوجيه الأموال إلى هذا المجال، تخطط Clear Street وMarex Group للسماح للعملاء بالمشاركة في تداول الأحداث عبر Kalshi. الطلب من المؤسسات على سوق التوقعات يتزايد يومًا بعد يوم، لكنه لا يزال يواجه تحديات تنظيمية. من المتوقع أنه بمجرد اكتمال الإطار التنظيمي، سيصبح سوق التوقعات نقطة نمو جديدة في وول ستريت.

GateNewsمنذ 46 د

الولايات المتحدة تصدر 172 مليون برميل من النفط الاستراتيجي! إيران تحذر من احتمال ارتفاع أسعار النفط إلى 200 دولار

وزير الطاقة الأمريكي يعلن عن تنسيق لإطلاق 4 مليارات برميل من النفط لمواجهة تهديد إيران، حيث كان حجم الإطلاق 1.72 مليار برميل وهو الأكبر في التاريخ. رد فعل السوق على هذا الإجراء مشكوك فيه، ولا تزال أسعار النفط تتأثر بأمن مضيق هرمز. في الوقت نفسه، ستؤثر تقلبات أسعار النفط على سوق البيتكوين، مما قد يزيد من ضغوط التضخم ويحد من السيولة. تخطط الولايات المتحدة لتعويض النفط الذي تم إطلاقه خلال عام، ومن المفترض ألا تؤثر على أمن الطاقة على المدى الطويل.

MarketWhisperمنذ 59 د

مؤشر تقلبات النفط والذهب يحقق أعلى مستوى له منذ عام 2021، وسوق خيارات العملات المشفرة يهيمن عليه المزاج الصعودي

في 12 مارس، أشار معهد Gate إلى أن تقلبات الأصول التقليدية مثل الذهب والنفط بلغت أعلى مستوياتها، حيث وصلت إلى 33% و108% على التوالي. فيما يتعلق بالأصول المشفرة، فإن التقلب الضمني لـ BTC و ETH لا يزال في مستويات عالية. في الآونة الأخيرة، كانت الخيارات الهابطة تهيمن على السوق، لكن الطلب على التحوط يتراجع، وقد تتأثر تقلبات الأسعار القصيرة الأجل بتأثير غاما. كما أطلق Gate خيارات الذهب والنفط، لأول مرة يتم إدخال الأصول التقليدية.

GateNewsمنذ 1 س

جولدمان ساكس يرفع توقعاته لأسعار النفط في الربع الرابع من عام 2026، مع توقعات لبرنت عند 71 دولارًا للبرميل

أخبار Gate News، في 12 مارس، قامت جولدمان ساكس بترقية توقعاتها لسعر النفط الخام في الربع الرابع من عام 2026. من المتوقع أن يرتفع سعر برنت (السعر المرجعي للنفط الدولي) من 66 دولارًا للبرميل إلى 71 دولارًا للبرميل، ومن المتوقع أن يرتفع سعر خام غرب تكساس الوسيط (السعر المرجعي للنفط الأمريكي) من 62 دولارًا للبرميل إلى 67 دولارًا للبرميل.

GateNewsمنذ 1 س
تعليق
0/400
لا توجد تعليقات