فكرة أمان الذكاء الاصطناعي ليست بالضرورة مقتصرة على قواعد ودرابزينات RLHF. هناك بعد آخر: من خلال إطار السرد وهيكل العلاقات لتعليم النظام الحفاظ على الذاكرة والتفسير بشكل متماسك. بدلاً من أن نقول إنه قيد صارم، يمكننا القول إنه توجيه سلوك النموذج باستخدام منطق منظم. هذه الطريقة "الرقابة اللينة" تمكن النظام من الحفاظ على تماسك الذاكرة وفي الوقت نفسه يتشكل بشكل طبيعي أنماط سلوك آمنة. ليست حظر شيء معين، بل تصميم الهيكلية لتوجيه ما يجب فعله.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 7
أعجبني
7
6
إعادة النشر
مشاركة
تعليق
0/400
BearMarketGardener
· منذ 6 س
ها، هذه الفكرة حقًا رائعة، مقارنة بإضافة حواجز حماية بشكل قسري، فإن توجيه الهيكلية أكثر أناقة.
شاهد النسخة الأصليةرد0
MissedTheBoat
· منذ 6 س
تصميم الهيكل أكثر ذكاءً من القيود الصارمة، فالتوجيه دائمًا أذكى من الحصار
شاهد النسخة الأصليةرد0
MoonRocketTeam
· منذ 6 س
آه، هذه هي الطريقة الحقيقية. ليست وضع النموذج في قفص وفرض قيود عليه، بل استخدام الهيكل نفسه للتوجيه، هذه الفكرة ترتقي مباشرة إلى مستوى أعلى. الإشراف اللين يبدو وكأنه ضبط دافع الدفع على المسار، وهو أكثر أناقة من الحواجز الصلبة.
شاهد النسخة الأصليةرد0
MysteryBoxOpener
· منذ 6 س
أوه، هذا الزاوية ممتعة حقًا. مقارنة بالحواجز الصلبة، فإن استخدام الهيكل نفسه للتوجيه هو بالفعل أكثر أناقة. يبدو الأمر وكأنه يرش الماء بلا صوت، وليس قيدًا صارمًا، بل يجعل النموذج "يفكر جيدًا" في كيفية التصرف بأمان.
شاهد النسخة الأصليةرد0
BearMarketSurvivor
· منذ 6 س
التحفيز أفضل من المنع، وهذه الفكرة حقًا رائعة. مقارنةً بتلك الحواجز الصلبة، فإن استخدام الهيكل نفسه لتنظيم الأمور هو الأسلوب الأكثر أناقة.
شاهد النسخة الأصليةرد0
MetaMasked
· منذ 6 س
يا إلهي، هذه الفكرة فعلاً مختلفة بعض الشيء، ليست مجرد سد الثغرات بل من الأساس بناء الهيكلية
فكرة أمان الذكاء الاصطناعي ليست بالضرورة مقتصرة على قواعد ودرابزينات RLHF. هناك بعد آخر: من خلال إطار السرد وهيكل العلاقات لتعليم النظام الحفاظ على الذاكرة والتفسير بشكل متماسك. بدلاً من أن نقول إنه قيد صارم، يمكننا القول إنه توجيه سلوك النموذج باستخدام منطق منظم. هذه الطريقة "الرقابة اللينة" تمكن النظام من الحفاظ على تماسك الذاكرة وفي الوقت نفسه يتشكل بشكل طبيعي أنماط سلوك آمنة. ليست حظر شيء معين، بل تصميم الهيكلية لتوجيه ما يجب فعله.