تم إصدار سلسلة نماذج GLM-5.1 REAP، مع توفير نسخ متعددة من التكميم والتقليم

robot
إنشاء الملخص قيد التقدم

أخبار ME، في 22 أبريل (بتوقيت UTC+8)، مؤخرًا، تم إصدار سلسلة نماذج GLM-5.1 من نموذج BF16 الذي يعتمد على 744 مليار معلمة. تم إنشاء هذه السلسلة من خلال تقنيات تقليم REAP وتقنيات التكميم المتنوعة، بهدف التوافق مع أجهزة مختلفة. يقوم تقليم REAP بتقييم مساهمة كل خبير في نموذج الخبراء المختلط، وإزالة الخبراء الأقل مساهمة وإعادة ترقيم بوابات التوجيه، بهدف تقليل خسارة الجودة. توفر السلسلة العديد من النسخ الأساسية بما في ذلك BF16، NVFP4، GPTQ W4A16 وGGUF، بحجم معلمات يتراوح من حوالي 285 جيجابايت إلى 1125 جيجابايت، ومُحسنة خصيصًا لمعالجات GPU أو CPU من معماريات Hopper وAmpere وBlackwell وغيرها. جميع النماذج مرخصة بموجب رخصة MIT، ويمكن نشرها باستخدام محركات مثل sglang وvLLM وllama.cpp. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت