تم إطلاق نموذج Qwen3.5-Omni متعدد الأوضاع من علي بابا كين وان

robot
إنشاء الملخص قيد التقدم

رسالة من Deep Tide TechFlow، في 30 مارس، وفقًا لتقرير صادر عن بيانات Jin10، أعلنت شركة Alibaba Qianwen عن إطلاق نموذج الذكاء الاصطناعي متعدد الوسائط بالكامل Qwen3.5-Omni. تتضمن سلسلة Qwen3.5-Omni إصدارات Instruct بثلاثة أحجام: Plus وFlash وLight، وتدعم سياقًا طويلًا حتى 256k. يدعم النموذج إدخالًا صوتيًا لأكثر من 10 ساعات، وإدخالًا للفيديو والصوت بجودة 720P (1FPS) لأكثر من 400 ثانية. تم إجراء تدريب مسبق متعدد الوسائط أصلي على النموذج باستخدام كميات ضخمة من البيانات النصية والمرئية، وكذلك على بيانات الفيديو والصوت التي تتجاوز 100 مليون ساعة، ويُظهر النموذج قدرات استثنائية في إدراك وتوليد متعدد الوسائط. مقارنةً بـ Qwen3-Omni، تم تعزيز قدرات Qwen3.5-Omni متعددة اللغات بشكل كبير، إذ يمكنه دعم التعرف على الكلام لهجات ولغات يبلغ عددها 113 لغة ولهجة، وتوليد الكلام لهجات ولغات يبلغ عددها 36 لغة ولهجة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.25Kعدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.31Kعدد الحائزين:2
    0.20%
  • القيمة السوقية:$2.28Kعدد الحائزين:2
    0.16%
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.29Kعدد الحائزين:2
    0.00%
  • تثبيت