لقد انتهيت للتو من اختبار بعض نماذج LLM المحلية على جهازي. إليكم ما لفت انتباهي:

نماذج التفكير؟ بطيئة بشكل مRidiculously. مثل، ببطء الحصول على قهوة.

على شريحة أبل سيليكون، يتم تدمير GGUF بواسطة MLX - إعداد MLX الخاص بي الذي يحتوي على 120 مليار في الواقع يتفوق على نموذج GGUF الذي يحتوي على 70 مليار. جنوني.

لكن Mistral-7B؟ سريع البرق بالنسبة لفئة وزنه. لا منافسة هناك.

أوه، وهذه النماذج الأكبر محملة بالمعرفة. إنه لأمر مثير للإعجاب حقًا ما اكتسبته.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 7

أعجبني
7
4
إعادة النشر
مشاركة

تعليق

0/400

MoneyBurner

· منذ 9 س

ها، لقد اختبرت بالفعل موضوع MLX الذي يضغط على GGUF، لكن 120B مقابل 70B لا يزال قويًا؟ أين البيانات؟ يجب النظر في الإثباتات داخل السلسلة قبل بناء مركز، وإلا فإنها ستكون تصريحات مراكز قصيرة.

شاهد النسخة الأصليةرد0

SignatureLiquidator