لقد انتهيت للتو من اختبار بعض نماذج LLM المحلية على جهازي. إليكم ما لفت انتباهي:
نماذج التفكير؟ بطيئة بشكل مRidiculously. مثل، ببطء الحصول على قهوة.
على شريحة أبل سيليكون، يتم تدمير GGUF بواسطة MLX - إعداد MLX الخاص بي الذي يحتوي على 120 مليار في الواقع يتفوق على نموذج GGUF الذي يحتوي على 70 مليار. جنوني.
لكن Mistral-7B؟ سريع البرق بالنسبة لفئة وزنه. لا منافسة هناك.
أوه، وهذه النماذج الأكبر محملة بالمعرفة. إنه لأمر مثير للإعجاب حقًا ما اكتسبته.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 7
أعجبني
7
4
إعادة النشر
مشاركة
تعليق
0/400
MoneyBurner
· منذ 9 س
ها، لقد اختبرت بالفعل موضوع MLX الذي يضغط على GGUF، لكن 120B مقابل 70B لا يزال قويًا؟ أين البيانات؟ يجب النظر في الإثباتات داخل السلسلة قبل بناء مركز، وإلا فإنها ستكون تصريحات مراكز قصيرة.
شاهد النسخة الأصليةرد0
SignatureLiquidator
· منذ 9 س
120B MLX تقتل GGUF مباشرة، هذه البيانات بعيدة جدا عن الواقع.
شاهد النسخة الأصليةرد0
ForkYouPayMe
· منذ 9 س
mlx حقًا رائع، بعد التبديل لم أعد أستطيع العودة إلى gguf.
لقد انتهيت للتو من اختبار بعض نماذج LLM المحلية على جهازي. إليكم ما لفت انتباهي:
نماذج التفكير؟ بطيئة بشكل مRidiculously. مثل، ببطء الحصول على قهوة.
على شريحة أبل سيليكون، يتم تدمير GGUF بواسطة MLX - إعداد MLX الخاص بي الذي يحتوي على 120 مليار في الواقع يتفوق على نموذج GGUF الذي يحتوي على 70 مليار. جنوني.
لكن Mistral-7B؟ سريع البرق بالنسبة لفئة وزنه. لا منافسة هناك.
أوه، وهذه النماذج الأكبر محملة بالمعرفة. إنه لأمر مثير للإعجاب حقًا ما اكتسبته.