11:25
إصدار النسخة الرسمية من DeepSeek V3.2: تعزيز قدرات الوكيل، دمج التفكير والاستدلال
ذكرت صحيفة Jinse Finance أنه اليوم، نحن نطلق نسختين رسميتين من النموذج: DeepSeek-V3.2 و DeepSeek-V3.2-Speciale. DeepSeek-V3.2 هو أول نموذج لدينا يدمج التفكير في استخدام الأدوات، ويدعم في نفس الوقت وضع التفكير ووضع عدم التفكير في استدعاء الأدوات. قدمنا طريقة لتوليد بيانات تدريب الوكيل على نطاق واسع، وقمنا بإنشاء عدد كبير من المهام التعزيزية "صعبة الحل، سهلة التحقق" (أكثر من 1800 بيئة، وأكثر من 85,000 تعليمات معقدة)، مما يزيد بشكل كبير من قدرة النموذج على التعميم. (DeepSeek)
- 1
- 2