المصدر: Xinzhiyuan
رجل جيد ، ** HUAWEI HarmonyOS Access Large Model ** ، هل يمكن للمساعد الذكي أن يلعب هكذا؟
بأمر صيني واحد فقط ، ستكتب Huawei Xiaoyi بريدًا إلكترونيًا باللغة الإنجليزية:
يمكنك استخدام الذكاء الاصطناعي لتحويل صورك إلى أنماط مختلفة:
يمكنك أيضًا التحدث بقائمة طويلة من التعليمات ، والسماح لها بإنشاء مشاهد معقدة بنفسها ، ويمكنك فهمها بلغة واضحة:
هذا هو ** Xiaoyi الجديد ** في ** HUAWEI HarmonyOS 4 **.
يعتمد على النموذج الكبير لقاعدة Pangu L0 من Huawei ، والذي يتضمن قدرًا كبيرًا من بيانات المشهد ، وضبط النموذج ، وأخيراً تحسين نموذج حوار الطبقة ** L1 **.
يمكنه التعامل مع مهام مثل إنشاء النص ، والبحث عن المعرفة ، وملخص البيانات ، والترتيب الذكي ، وفهم الغموض / المعقد.
علاوة على ذلك ، يمكن أيضًا استدعاء خدمات APP المختلفة لتحقيق تجربة ذكية على مستوى النظام.
لذا ، ما الذي يمكن أن يفعله هاتف Huawei Xiaoyi الجديد؟
بناءً على قدرة الطرز الكبيرة ، قامت Huawei Xiaoyi بالترقية بشكل أساسي في ثلاثة جوانب هذه المرة:
تشمل تحسينات القدرات المحددة المزيد من حوارات اللغة الطبيعية ، ومسابقات المعرفة حول أجهزة الألعاب ، والبحث عن خدمات الحياة ، ومحتوى شاشة التعرف على الحوار ، وإنشاء صور موجزة لكتابة النصوص ، وما إلى ذلك.
** أولاً وقبل كل شيء ، تجعل ترقية التفاعل الذكي الحوار والتفاعل أكثر طبيعية وسلاسة. **
يمكن لـ Huawei Xiaoyi فهم ** العامية ** وفهم ** المقاصد الغامضة ** و ** الأوامر المعقدة **.
إذا لم تتمكن من العثور على أحدث وظيفة لإعداد خلفية الشاشة ، ولا تعرف اسم الوظيفة ، فيمكنك أن تسأل مباشرة:
كيفية تغيير خلفية الشاشة التي يمكن أن تتغير في الوقت الفعلي وفقًا للطقس؟
أو أمر معقد بمتطلبات متعددة:
ابحث عن مطعم للمأكولات البحرية عالي التصنيف بالقرب من بحيرة سونغشان ، ويفضل أن يكون ذلك مع وجبة محددة مخفضة السعر لأربعة أشخاص.
يمكن لـ Xiaoyi أيضًا الاتصال بالخدمة للعثور على مطعم يلبي المتطلبات.
في الوقت نفسه ، تتمتع Xiaoyi أيضًا بقدرات متعددة الوسائط ، ** يمكنها فهم محتوى الصورة **. بهذه الطريقة ، يمكن أيضًا تسليم الخطوات التي كان على المستخدمين قراءتها ثم تشغيلها يدويًا إلى Xiaoyi.
على سبيل المثال ، دعه ينظر إلى خطاب دعوة ويقول:
انتقل إلى العنوان على الخريطة.
يمكنه استخراج معلومات العنوان على الخريطة والاتصال بخدمة الخرائط للملاحة.
أو احفظ معلومات الاتصال في الدعوة ، ويمكنك أن ترى أنه يمكن فهم المعلومات النصية في الصورة جيدًا.
للمضي قدمًا ، يمكننا الآن تنفيذ ** ترتيب المهام المعقدة ** من خلال Xiaoyi ، لذلك لا نحتاج إلى تعيينها يدويًا بشكل متكرر.
على سبيل المثال ، يمكنك تركه يضبط مشهد الجري الصباحي:
ساعدني في إنشاء مشهد الجري الصباحي. كل يوم إثنين إلى جمعة في الساعة 6:30 صباحًا ، سأبث طقس اليوم من أجلي. عندما أضع سماعات البلوتوث الخاصة بي ، أقوم بتشغيل الأغاني المفضلة وأضع هاتفي في الوضع الصامت.
يمكن لـ Xiaoyi فهم هذه القائمة الطويلة من المتطلبات ، ثم استدعاء وظائف مختلفة. واستنادًا إلى حالة الهاتف المحمول (ما إذا كانت سماعة البلوتوث متصلة) ، يمكن الحكم على إجراء عمليات معينة.
** ثانيًا ، بفضل الإمكانات مثل الطرازات الكبيرة ، يمكن لـ Xiaoyi الآن توفير أدوات إنتاجية أكثر كفاءة **.
مساعدتك في الرؤية والقراءة والكتابة.
على سبيل المثال ، أظهر لها مقالًا باللغة الإنجليزية ، ثم اسأل عما يقال في هذه المقالة؟
يمكن أن يعطي Xiaoyi تفسيرات بسيطة وموجزة باللغة الصينية.
إذا طلب المستخدم منه تذكر بعض المعلومات في الماضي ، فيمكن أيضًا استدعائه لإنشاء محتوى مطابق.
في غضون أيام قليلة ، سأحدد موعدًا مع ديفيد لمناقشة المشروع. وبجمع المعلومات من الاجتماع الأخير ، سأكتب بريدًا إلكترونيًا لموعد الاجتماع باللغة الإنجليزية.
بما في ذلك ما تم ذكره في البداية ، يمكن لـ Xiaoyi أيضًا استخدام القدرة البصرية AI لإنشاء صور في أنماط مختلفة.
** أخيرًا ، كمساعد ذكي ، يدعم Xiaoyi الآن خدمات أكثر تخصيصًا ويمكنه فهمك بشكل أفضل. **
يمكن استخدامه كمفكرة ومذكرة ، ويمكن تسجيل بعض الأشياء الصغيرة شفهياً.
صرحت Huawei أن ** جميع محتويات الذاكرة مكتملة بموجب إذن المستخدم وستحمي خصوصية المستخدم بشكل كامل. **
بالإضافة إلى ذلك ، يمكن لـ Xiaoyi Suggestion الآن رؤية المزيد من المشاهد عالية التردد للمستخدمين ، ويمكن أن تقدم بنشاط اقتراحات تركيبة ذكية وقفة واحدة ، مما يوفر الكثير من عمليات البحث اليدوي.
على سبيل المثال ، في سيناريو السفر إلى الخارج ، يمكن لـ Xiaoyi تذكير أحدث سعر صرف في الوقت الفعلي قبل المغادرة ، وتبادل العملات الأجنبية ، ومساعدة المستخدمين في الحصول على إستراتيجيات السفر في الوجهة في الوقت الفعلي ؛ وأدوات الترجمة في الوقت الفعلي والمزيد.
وفقًا للتقارير ، ** ازداد المشهد الذكي الجديد Xiaoyi بمقدار 3 مرات ، وزاد عدد نقاط الاهتمام بمقدار 7 مرات ** ، والتي يمكن أن تغطي متاجر التموين والتسوق الأساسية ، والمناطق التجارية ، ومحطات السكك الحديدية عالية السرعة في المطارات وغيرها. سيناريوهات.
باختصار ، لم تحصل Xiaoyi الجديدة على أحدث قدرات AIGC فحسب ، بل حسنت أيضًا بعض أوجه القصور في المساعدين الصوتيين للهاتف المحمول والتي غالبًا ما تم انتقادها في الماضي.
مثل نقص الذاكرة ، والحوار الباهت ، وعدم فهم اللغة العامية ، إلخ …
كل هذا استفاد بالطبع من مباركة النموذج الكبير ، لكن كيف فعل شياويي ذلك؟
النموذج الأساسي الذي يعتمد عليه Xiaoyi هو ** Huawei Pangu Series **.
في يوليو من هذا العام ، أصدرت Huawei رسميًا Pangu Large Model 3.0 ، واقترحت بنية نموذجية ثلاثية الطبقات.
من بينها ، يحتوي الإصدار الأكبر من النموذج الكبير الأساسي لطبقة L0 على 100 مليار معلمة ، ويستخدم التدريب المسبق أكثر من 3 تريليون من الرموز المميزة.
استنادًا إلى النموذج الكبير لقاعدة Pangu L0 من Huawei ، قام Xiaoyi ببناء كمية كبيرة من بيانات المشهد لسيناريوهات المستهلك النهائي ، وضبط النموذج ، وأخيراً صقل نموذج حوار الطبقة ** L1 **.
في الضبط الدقيق ، أضافت Xiaoyi أنواع البيانات السائدة التي تغطي المستهلكين النهائيين ، مثل المحادثات ، وأدلة السفر ، والتحكم في المعدات ، والطعام ، والملابس ، والإسكان ، والنقل ، إلخ.
يمكن أن يغطي هذا النطاق المعرفي للمحادثات اليومية للمستخدمين العاديين ، ويمكن أن يعزز الواقعية ، والأداء في الوقت الفعلي ، والامتثال الأمني ، وما إلى ذلك في عملية الحوار الخاصة بالنموذج.
ومع ذلك ، كما نعلم جميعًا ، فإن النماذج الكبيرة تمثل تحديًا كبيرًا في ** النشر والاستجابة السريعة ** نظرًا لخصائصها واسعة النطاق.
فيما يتعلق بالنشر ، تعمل Huawei باستمرار على تحسين قدرة النموذج واسع النطاق ** التعاون بين الجهاز والسحابة **. يمكن للنموذج الكبير من جانب الجهاز تنفيذ طبقة من المعالجة المسبقة على طلبات المستخدم ومعلومات السياق ، ثم إرسال الطلب المعالج مسبقًا إلى جانب السحابة.
تتمثل ميزة القيام بذلك في أنه لا يمكنه فقط الاستفادة من الاستجابة السريعة ** لنموذج الجانب النهائي ** ، ولكن أيضًا تحسين جودة الأسئلة والأجوبة والاستجابة من خلال نموذج السحابة ، وفي الوقت نفسه حماية خصوصية المستخدم بشكل أكبر بيانات.
فيما يتعلق بتقليل تأخير الاستدلال ، قامت Huawei Xiaoyi بإجراء ** تحسين هندسي منهجي ** ، بما في ذلك الارتباط الكامل من الشريحة الأساسية وإطار الاستدلال ومشغل النموذج وطول الإدخال والإخراج.
من خلال تفكيك التأخير الزمني لكل وحدة ، أوضح فريق البحث والتطوير أهداف التحسين لكل جزء ، وقلل التأخير الزمني عن طريق اندماج المشغل ، وتحسين الذاكرة ، وتحسين خط الأنابيب.
في الوقت نفسه ، سيؤثر الطول وطول الإخراج أيضًا على سرعة الاستدلال للنماذج الكبيرة.
في هذا الصدد ، أجرت Huawei تحليلًا وضغطًا لكلمة لكلمة لسيناريوهات مختلفة وتنسيقات إخراج ، وأدركت أخيرًا ** تأخير التفكير إلى النصف **.
من منظور الهيكل الفني العام ، فإن تكامل Huawei Xiaoyi والنموذج الكبير ليس فقط لتعزيز المهام مثل الدردشة و AIGC والرد ، ولكن لإجراء تحسينات على مستوى النظام مع النموذج الكبير باعتباره جوهرًا.
** بمعنى آخر ، دع النموذج الكبير يصبح “عقل” النظام. **
منطقها الأساسي هو: تعيين مهام المستخدم للأنظمة المناسبة ، كل نظام يؤدي واجباته الخاصة ، وفي نفس الوقت يعزز التجربة في السيناريوهات المعقدة.
بالنظر تحديدًا إلى عملية الحوار النموذجية لـ Xiaoyi ، يمكن تقسيمها إلى ثلاث خطوات:
** الخطوة الأولى ** هي تلقي أسئلة المستخدم وتحليل كيفية التعامل معها بناءً على فهم السياق / قدرة Xiaoyi على التذكر.
** الخطوة الثانية ** ، استدعاء إمكانيات مختلفة وفقًا لنوع الطلب ، بما في ذلك استرجاع الخدمة الفوقية وتوليد الأفكار واسترجاع المعرفة.
** إذا كان الطلب الذي بدأه المستخدم يتضمن خدمات وصفية ** ، على سبيل المثال ، إذا سأل عن المطاعم القريبة التي يمكن استخدامها للتجمعات ، فإن هذا يتضمن استدعاء خدمة APP الذواقة. يحتاج النظام إلى إنشاء واجهة برمجة تطبيقات ، وأخيرًا ، سيقدم طرف الخدمة ردًا بناءً على آلية التوصية.
** إذا سأل المستخدم سؤالاً معرفيًا ** ، مثل السؤال عن عدد معلمات نموذج Pangu. في هذا الوقت ، سيستدعي النظام محرك البحث ، والمعرفة بالمجال المقابل ، والمعرفة المتجهية للاستعلام ، ثم يولد إجابة من خلال الاندماج.
** إذا كان طلب المستخدم عبارة عن مهمة إنشائية ** ، فيمكن للنموذج الكبير أن يقدم ردًا من خلال قدرته الخاصة.
في الخطوة الأخيرة ، سيتم تقييم جميع الإجابات التي تم إنشاؤها عن طريق التحكم في المخاطر وإعادتها إلى المستخدم.
بالإضافة إلى ذلك ، سيطرت Xiaoyi على التفاصيل ونفذت سلسلة من التطوير منخفض المستوى لضمان تأثير السؤال والجواب وتنفيذ المهام.
** يمكنك إلقاء نظرة على جانب البيانات **.
منذ أن دخل Xiaoyi عبر الإنترنت على HarmonyOS في عام 2017 ، جمع قدرًا معينًا من عادات الحوار للمستخدمين العاديين. علاوة على ذلك ، قامت Huawei ببناء مجموعة كبيرة من أنواع التعبيرات المختلفة لتغطية أكبر عدد ممكن من التعبيرات المكتوبة والمنطوقة ، بحيث يمكن للنموذج الكبير أن يكون بارعًا في التعبيرات المختلفة أثناء مرحلة ما قبل التدريب.
من أجل تقييم وتحسين قدرة Xiaoyi بشكل أفضل ، ** قامت Huawei ببناء مجموعة بيانات اختبار كاملة **.
لا يمكن لهذا فقط تقييم قدرات النماذج الكبيرة المفتوحة الموجودة ، ولكن أيضًا توجيه Xiaoyi لبناء البيانات والقدرات بناءً على نتائج التقييم.
** أريد أن يتقن Xiaoyi أداة استدعاء الأداة ، وهو أمر صعب للغاية **.
يتطلب التحكم في المعدات نموذجًا كبيرًا لإنشاء نص بتنسيق معقد بمئات الرموز ، ويجب ألا تكون هناك أخطاء في التنسيق ، وإلا فلن يتمكن نظام التحكم المركزي من التحليل والاتصال.
من أجل السماح للنموذج الكبير بالوفاء بمعيار الجيل هذا ، اعتادت Huawei على فهم “مزاج” النموذج الكبير من ناحية ، وفي نفس الوقت تقوية قدرة الشفرة للنموذج الكبير ، ثم تحسين التنسيق القدرة على الامتثال للنموذج ، وأدركت أخيرًا أن التنسيق ** متوافق تقريبًا بنسبة 100٪ **.
بالنسبة للسيناريوهات المعقدة ، تتمثل طريقة Xiaoyi في استخدام قدرة النماذج الكبيرة على التعلم الكامل وفهم سيناريوهات الأداة ، ومن ثم السبب.
من المفهوم أن الفريق قام بتحسين تأثير التحكم في المعدات النموذجية من كونها غير قابلة للاستخدام تمامًا إلى توفر أكثر من 80٪.
بالإضافة إلى ذلك ، يتيح ** HarmonyOS الأصلي أيضًا إمكانية تحسين واجهة برمجة التطبيقات الحالية ** ، ومن خلال هذا التكيف العكسي ، يمكن أيضًا الاستفادة بشكل أفضل من مزايا النماذج الكبيرة.
إذن ، لماذا تستطيع Huawei نشر إمكانات نموذجية واسعة النطاق للمساعدين الأذكياء بهذه السرعة؟
إن التراكم والبحث في مجال البحث والتطوير الأساسيين ضروريان ، ولكن هناك شيء آخر يستحق الاهتمام——
اختارت Huawei أن تبدأ من المشهد الفعلي لتحديد كيفية دمج النموذج الكبير مع المساعد الذكي وحتى نظام التشغيل بأكمله.
بكلمات Huawei الخاصة:
الحديث رخيص. أرني العرض التوضيحي.
تأتي العديد من التجارب الموضحة أعلاه أيضًا من التصورات اليومية لأعضاء فريق البحث والتطوير في Huawei.
على سبيل المثال ، اعتاد بعض الأشخاص على تلقي الأخبار في الطريق من وإلى العمل ، ومن غير الملائم قراءة المعلومات الطويلة والاستماع إليها ، لذلك تظهر وظيفة ملخص المعلومات في Huawei Xiaoyi.
يجد بعض الأشخاص أنهم دائمًا ما يفتقرون إلى الكلمات عند كتابة مراجعات التسوق ورغبات أعياد الميلاد ، لذلك توفر Huawei Xiaoyi وظيفة كتابة الإعلانات.
وهذا التركيز على تجربة المشهد هو الميزة الطبيعية لـ HarmonyOS.
منذ ولادته ، لم يقتصر HarmonyOS على الهواتف المحمولة ، بل تم توجيهه إلى العديد من المحطات الطرفية وجميع السيناريوهات.
الآن قامت بإنشاء بيئة كاملة السيناريو “1 + 8 + N”.
** تم نشر Huawei Xiaoyi أيضًا على أجهزة 1 + 8 **. في المستقبل ، ستجمع بين شكل الأعمال للأجهزة ذات السيناريوهات الكاملة وتنشر Xiaoyi تدريجيًا مع إمكانات النماذج واسعة النطاق لتجربة السيناريوهات الكاملة للمستهلكين.
كمساعد ذكي مدفوع بالذكاء الاصطناعي ، عملت Xiaoyi على دمج قدرات الذكاء الاصطناعي المختلفة منذ ولادتها ، مثل ترجمات AI وقراءة Xiaoyi بصوت عالٍ. لقد أولى فريق البحث والتطوير الذي يقف وراءه اهتمامًا دائمًا لمزيد من إمكانيات الذكاء الاصطناعي والمساعدين الأذكياء.
وفقًا للتقارير ، في العام الماضي ، لاحظ الفريق أن عشرات المليارات من نماذج ما قبل التدريب جنبًا إلى جنب مع التكنولوجيا السريعة يمكن أن توفر بالفعل فهمًا جيدًا للنص وقدرات التوليد ، ويمكن استخدامها في المحادثات الصغيرة ، والأسئلة والأجوبة ، والمهمة- الحوار القائم.
مع اندلاع أحدث جولة من اتجاهات الذكاء الاصطناعي ، أدخلت RLHF تحسينات كبيرة على النماذج الكبيرة ، وافتتح باب الهبوط الصناعي رسميًا.
منذ ظهور اتجاه الذكاء الاصطناعي التوليدي هذا العام ، اختارت العديد من التطبيقات الوصول إلى إمكانات نماذج كبيرة ومساعدين أذكياء مدمجين.
ومع ذلك ، باعتبارها واحدة من أكثر الشركات المصنعة لأنظمة التشغيل في العالم ، اختارت Huawei التقليل من مستوى أدنى واستخدام نموذج كبير لإعادة تشكيل نظام التشغيل.
** يعني المستوى الأدنى مزيدًا من الدقة والشمول **.
ولكن بالنسبة للبحث والتطوير ، فإن التحدي أكبر.
هذا لا يتطلب فقط قاعدة نموذجية صلبة بما فيه الكفاية ، ولكنه يتطلب أيضًا تحسين الانصهار على مستوى النظام ، ويضع أيضًا متطلبات لفهم المشهد وتصور طلب المستخدم.
في المقابل ، تعد Huawei واحدة من أوائل الشركات المصنعة المحلية التي تتمتع بقدرات نموذجية واسعة النطاق ؛ تبني قدرات تطوير متكاملة للذكاء الاصطناعي ؛ يغطي HarmonyOS أكثر من 700 مليون جهاز …
لذلك ، ليس من الصعب فهم سبب وصول Huawei Xiaoyi بسرعة إلى قدرة الطرز الكبيرة ، مما يجعل HarmonyOS 4 أول نظام تشغيل للوصول الكامل إلى الطرز الكبيرة.
باعتباره أحد أكثر أنظمة التشغيل اهتمامًا في العالم ، فإن HarmonyOS يأخذ زمام المبادرة في احتضان النماذج الكبيرة ، وقد يفتح أيضًا نموذجًا جديدًا ، مما يسمح للجميع بفتح هواتفهم لتجربة إمكانيات الطرز الكبيرة ، التي لم تعد تقتصر على الخيال.
** حاليًا ، أعلنت Huawei عن خطة اختبار Xiaoyi: **
ستتم دعوة Xiaoyi الجديد تمامًا للاختبار في نهاية أغسطس من هذا العام ، وسيتم ترقيته من خلال OTA في بعض الطرز المجهزة بنظام HarmonyOS 4.0 وما بعده ، وسيتم الإعلان عن خطة الترقية المحددة لاحقًا.
إذا كنت مهتمًا بأحذية الأطفال ، يمكنك القدوم وإلقاء نظرة ~