كشف الستار عن DeepSeek: قصة تحلم بتحقيق الأفضل في التكنولوجيا في الصين

金色财经_
WAVES1.44%
TOKEN0.1%

المؤلف: يو لي لي؛ المصدر: أن يونغ ويفز

من بين 7 شركات نموذجية كبيرة في الصين، يبقى DeepSeek (ديبسيك) هادئاً جداً، لكنه يتمكن دائمًا من أن يكون محفورًا في الذاكرة بطريقة غير متوقعة.

قبل عام، كانت هذه المفاجأة تأتي من وراء العملاق الكمي الخاص بها، وهي شركة الوحيدة خارج الشركات الكبيرة التي تحتفظ بألف رقاقة A100، وبعد عام، جاءت هذه المفاجأة من وراء الشركة التي تسببت في بداية حرب أسعار النماذج الكبيرة في الصين.

في شهر مايو الذي تعرضت فيه لقصف مستمر من الذكاء الاصطناعي ، أصبحت DeepSeek مشهورة. السبب في ذلك هو إصدارهم لنموذج مفتوح المصدر يسمى DeepSeek V2 ، الذي يوفر تكلفة غير مسبوقة: تم تخفيض تكلفة الاستدلال إلى 1 دولار فقط لكل مليون رمز ، وهو يعادل حوالي سبعة أجزاء من Llama3 70B و سبعون جزءًا من GPT-4 Turbo.

سُمِّيَ DeepSeek بسرعة “بينغ دو بينغ” في عالم الذكاء الاصطناعي. في الوقت نفسه، لا يمكن للشركات الكبيرة مثل ByteDance وTencent وBaidu وAlibaba أن تتحمل الأسعار المرتفعة، مما يؤدي إلى اندلاع حرب الأسعار للنماذج الضخمة في الصين.

** يحجب الدخان في الواقع حقيقة أنه على عكس العديد من المصانع الكبيرة التي تحرق الأموال لدعم ، فإن DeepSeek مربحة. **

هذا وراء ذلك، تمت إجراء تجديد شامل لبنية النموذج من قبل DeepSeek. قدم نوع جديد من بنية MLA (آلية انتباه متعددة الرؤوس جديدة) التي تقلل استخدام الذاكرة الظاهرية إلى 5%-13% من بنية MHA الأكثر استخدامًا في الماضي، في الوقت نفسه، بنية DeepSeekMoESparse الفريدة أيضًا تقلل الحساب بشكل كبير، وكل هذه العوامل في النهاية أدت إلى انخفاض التكلفة.

في وادي السيليكون ، يُطلق على DeepSeek اسم ‘القوة الغامضة من الشرق’. يعتقد كبير المحللين في SemiAnalysis أن ورقة DeepSeek V2 ‘قد تكون أفضل ورقة لهذا العام’. يعتبر أندرو كار ، العامل السابق في OpenAI ، أن الورقة ‘مليئة بالحكمة المدهشة’ وقام بتطبيق إعدادها لنموذجه الخاص. يعتقد جاك كلارك ، السابق لدى OpenAI كمدير سياسات ومؤسس شركة Anthropic ، أن DeepSeek ‘قد استعان بمجموعة من العباقرة العميقة والمحيرة’ ، وأن النماذج الكبيرة التي تم تصنيعها في الصين ‘ستصبح قوة لا يمكن تجاهلها مثل الطائرات بدون طيار والسيارات الكهربائية.’

** هذا أمر نادر الحدوث في موجة من الذكاء الاصطناعي مدفوعة إلى حد كبير بوادي السيليكون. أخبرنا عدد من المطلعين على الصناعة أن هذه الاستجابة القوية تأتي من الابتكار على مستوى الهندسة المعمارية ، وهي محاولة نادرة من قبل شركات النماذج الكبيرة المحلية وحتى النماذج الكبيرة ذات القاعدة العالمية مفتوحة المصدر. ** وفقا لباحث الذكاء الاصطناعي ، بالكاد تم تعديل بنية الانتباه بنجاح على مر السنين ، ناهيك عن التحقق منها على نطاق واسع. “إنها حتى فكرة يتم قطعها عند اتخاذ قرار ، لأن معظم الناس يفتقرون إلى الثقة.”

ومن ناحية أخرى، لم يكن من المعتاد أن تدخل النماذج الكبيرة المحلية في مجال الهندسة المعمارية الابتكارية من قبل، وذلك لأن هناك قليلًا جدًا من الأشخاص الذين يتطوعون لتحطيم هذا النوع من الأفكار المسبقة: الولايات المتحدة تجيد الابتكار التقني من 0-1، بينما تجيد الصين الابتكار التطبيقي من 1-10. بالإضافة إلى أن هذا السلوك غير مجدي للغاية - سيتم إنتاج جيل جديد من النماذج خلال بضعة أشهر، ويكفي للشركات الصينية أن تتبع وتقوم بتطبيقات جيدة. الابتكار في هيكل النموذج يعني عدم وجود مسار محدد للالتزام به، ويتطلب الأمر العديد من الفشل، مما يستنزف الوقت والتكاليف الاقتصادية.

يبدو أن DeepSeek هو متمرد. في ضجة تعتقد أن تكنولوجيا النماذج الكبيرة تتجه بالضرورة نحو الاقتران ، يقدر DeepSeek القيمة المكتسبة في “المسار المنحني” ويعتقد أن رواد الأعمال في مجال النماذج الكبيرة في الصين يمكنهم أيضًا الانضمام إلى تيار الابتكار التكنولوجي العالمي بجانب الابتكار في التطبيقات.

الكثير من قرارات ديبسيك تختلف عن الآخرين. حتى الآن، من بين 7 شركات ناشئة كبيرة في الصين، فإنها الوحيدة التي تتخلى عن مسار ‘كلي و مستهلك’، وحتى الآن تركز فقط على البحث والتكنولوجيا، وهي الشركة الوحيدة التي لم تفكر بشكل شامل في التجارة، واختارت بحزم مسار الشفافية حتى لم تقم بجمع الأموال. كل هذه الأمور تجعلها غالبًا ما تُنسى خارج الحلبة، ولكن من ناحية أخرى، فإنها غالبًا ما تنتشر في المجتمع كما لو كانت ‘مياه الحنفية’ بواسطة المستخدمين.

كيف تم تشكيل DeepSeek؟ لقد قمنا بمقابلة مؤسس DeepSeek الذي نادراً ما يظهر، ليانغ ونفين.

لا يزال مؤسس ما بعد 80s ، الذي كان يدرس التكنولوجيا وراء الكواليس منذ عصر High-Flyer ، يواصل أسلوبه المنخفض المستوى في عصر DeepSeek ، ومثل جميع الباحثين ، “يقرأ الأوراق ويكتب التعليمات البرمجية ويشارك في المناقشات الجماعية” كل يوم.

مثل العديد من مؤسسي الصناديق الكمية ، لديه خلفية في صناديق التحوط الأجنبية ، ولكن الاختلاف الرئيسي هو أن ليانغ وينفنغ لديه خلفية محلية ، فقد درس في جامعة تشجيانغ للتكنولوجيا في قسم الهندسة الإلكترونية وتوجه الذكاء الاصطناعي.

قال عدد من المتخصصين في مجال التكنولوجيا وباحثو DeepSeek لنا إن Liang Wenfeng هو شخص نادر جدًا في مجال الذكاء الاصطناعي في الصين في الوقت الحالي، حيث إنه “لديه قدرات هندسية قوية في مجال البنية التحتية وقدرة بحثية في النماذج، بالإضافة إلى قدرته على تنسيق الموارد”، وهو “يمكنه اتخاذ قرارات دقيقة من مستوى عالٍ، وفي الوقت نفسه يمكنه تفوق باحترافية على الباحثين الرئيسيين في التفاصيل”، وهو يمتلك “قدرة تعلم مخيفة”، وفي الوقت نفسه “لا يبدو على الإطلاق كرئيس، بل يبدو أكثر كمحترف في التكنولوجيا”.

هذه مقابلة نادرة للغاية. في هذه المقابلة، قدم هذا المتحمس للتكنولوجيا صوتًا نادرًا في الصناعة التكنولوجية الصينية حاليًا: إنه أحد القلائل الذين يضعون “القناعة بالحق والخطأ” قبل “المصلحة الذاتية” ويذكرونا بعصر العادات والتقاليد ويضعون “الابتكار الأصلي” في أولوياتنا.

قبل عام وقع DeepSeek ، لقد حدثنا لأول مرة مع Liang Wenfeng: “مربعات سحرية مجنونة: طريق عملاق الذكاء الاصطناعي الخفي”. إذا كانت العبارة “يجب أن نحتضن الطموح بجنون ونكون جنونيين بصدق” لا تزال شعاراً جميلاً في ذلك الوقت، فقد تحولت إلى عمل بعد مرور عام واحد.

** هذا جزء من الحوار **

كيف تم إطلاق أول رصاصة في حرب الأسعار؟

“الإندفاع الداكن”: بعد إطلاق نموذج DeepSeek V2، أثارت حرب الأسعار الضخمة سيلًا من الدماء والعنف، ويقول البعض إنكم سمكة قرش في هذه الصناعة.

ليانغ ونفنغ: لم نكن نعني أن نصبح سمكة قناديل، فقط أصبحنا سمكة قناديل بطريق الخطأ.

‘التيار الداكن’: هل هذه النتيجة مفاجئة لكم؟

梁文锋: مفاجأة كبيرة. لم نكن نتوقع أن يكون السعر مثيرًا للحساسية لهذه الدرجة. نحن نتبع إيقاعنا الخاص ونقوم بحساب التكاليف وتحديد الأسعار. مبدأنا هو عدم التلاعب بالأسعار وعدم الربح الفاحش. هذا السعر فقط يحقق ربحًا طفيفًا فوق التكلفة.

‘تيداك’:بعد 5 أيام تليها شركات مثل ‘بايت دانس’ و ‘علي بابا’ و ‘بايدو’ و ‘تنتشوانغ’ وغيرها من الشركات الكبيرة.

ليانغ وينفنغ: ذكاء برو AI هو منتج مستوى مبتدئ، ونماذجنا في نفس المستوى ما زالت مكلفة جدًا. بايت هي أول من تبنا حقًا. تم خفض النموذج الرئيسي إلى نفس سعرنا، مما أدى إلى تخفيض الأسعار من قبل الشركات الأخرى. نظرًا لأن تكلفة نماذج الشركات الكبيرة أعلى بكثير من تكلفتنا، لم نكن نتوقع أن يخسر شخص ما في هذا الأمر، وفي النهاية تحول الأمر إلى منطق دعم الحرق في عصر الإنترنت.

「إندفاع الظلام」: من الخارج، يبدو أن الخفض في السعر يشبه سرقة المستخدمين، وعادة ما تكون الحروب السعرية في عصر الإنترنت كذلك.

梁文锋:سرقة المستخدمين ليست هدفنا الرئيسي. لقد قلصنا الأسعار لأسباب من جهة لأننا قمنا بتخفيض تكلفة الهيكل الجديد من الجيل القادم، ومن جهة أخرى، نعتقد أن كل من واجهة برمجة التطبيقات (API) والذكاء الاصطناعي يجب أن يكونا شيئًا شاملاً يمكن للجميع تحمله.

“التيار الداكن”: في الماضي، قامت معظم الشركات الصينية بنسخ هيكل Llama من هذا الجيل مباشرة لتطبيقاتها، لماذا تقومون بالانتقال إلى هيكل النموذج؟

梁文锋:إذا كان الهدف هو تطوير التطبيقات، فإن استخدام هيكل Llama وتقديم منتجات سريعة وفعالة يعتبر خيارًا معقولًا. ولكن هدفنا هو AGI، وهذا يعني أن علينا أن نبحث في هياكل نماذج جديدة، وبموارد محدودة، لتحقيق قدرات نموذجية أقوى. هذا هو أحد الأبحاث الأساسية التي يجب إجراؤها لتوسيع النماذج إلى حجم أكبر. بالإضافة إلى الهيكل النموذجي، قمنا بالعديد من الأبحاث الأخرى، بما في ذلك كيفية تكوين البيانات، وكيفية جعل النموذج أكثر تشابهًا بالبشر، وهذا يتجلى في النماذج التي نقوم بنشرها. بالإضافة إلى ذلك، يبدو أن هيكل Llama يختلف عن المستوى المتقدم في الخارج بجيلين من حيث كفاءة التدريب وتكلفة الاستدلال.

“التيار الكهربائي الخفي”:من أين يأتي هذا الفارق الرئيسي؟

Liáng Wénfēng: أولاً ، هناك فجوة في كفاءة التدريب. نحن نقدر أن أفضل المستويات المحلية مقارنة بأفضل المستويات الأجنبية ، قد يكون هناك اختلاف في هيكل النموذج وديناميكية التدريب بنسبة ضعف واحدة ، فقط لتحقيق نفس الأداء ، نحتاج إلى استهلاك ضعفي القوة الحسابية. بالإضافة إلى ذلك ، قد يكون هناك اختلاف بنسبة ضعف واحدة في كفاءة البيانات ، وهذا يعني أننا بحاجة إلى استهلاك ضعفي كمية البيانات والقوة الحسابية لتحقيق نفس الأداء. كل ذلك يتطلب استهلاك ضعفي قوة الحساب. ما نحاول القيام به هو تقليص هذه الفجوات باستمرار.

**“التيار الداكن”: معظم الشركات الصينية تختار نموذج وتطبيق، لماذا اختار DeepSeek حالياً القيام بالبحث والاستكشاف فقط؟"

梁文锋:لأننا نعتقد أن المشاركة في موجة الابتكار العالمية هي الأهم في الوقت الحالي. على مدى السنوات العديدة الماضية، اعتادت الشركات الصينية على أن يقوم الآخرون بالابتكار التكنولوجي، ثم نقوم بتطبيقه وتحقيق الربح، ولكن هذا ليس أمرًا مفروغًا له. في هذه الموجة، نقطة انطلاقنا ليست لتحقيق ربح سريع، بل هي الوصول إلى طرف التكنولوجيا والعمل على تعزيز تطور البيئة بأكملها.

“اندفاع مظلم”: الفهم التقليدي للعديد من الناس في عصر الإنترنت والإنترنت المتنقل هو أن الولايات المتحدة تجيد الابتكار التكنولوجي، بينما تجيد الصين التطبيقات.

Liang Wenfeng: نعتقد أنه مع تطور الاقتصاد، يجب على الصين أن تصبح مساهمًا تدريجيًا بدلاً من الاعتماد دائمًا على الآخرين. خلال أكثر من ثلاثين عامًا من موجة تكنولوجيا المعلومات، لم نشارك في الابتكار التقني الحقيقي. لقد تعودنا على قدوم مبدأ مور وتحسين الأجهزة والبرمجيات كل 18 شهرًا. ويتم التعامل مع Scaling Law بنفس الطريقة.**

ولكن في الواقع، هذا هو ما تم إنشاؤه من قبل مجتمع تقني يتزعمه الغرب، فقط لأننا لم نشارك في هذه العملية في السابق، بحيث تجاهلنا وجودها.

الفارق الحقيقي ليس عامًا أو عامين، بل الفارق بين الأصالة والتقليد

‘المد الداكن’: لماذا يدهش DeepSeek V2 العديد من الأشخاص في وادي السيليكون؟

ليانغ ونفينغ: في الكثير من الابتكارات التي تحدث يوميًا في الولايات المتحدة، هذا أمر عادي للغاية. إنهم مذهولون لأن هذه شركة صينية، تنضم كمساهم في الابتكار إلى لعبتهم. بعد كل شيء، معظم الشركات الصينية تعتاد على المتابعة، لا على الابتكار.

“الاندفاع الغامض”: ومع ذلك، فإن هذا الخيار مفرط في سياق اللغة الصينية. النموذج الكبير هو لعبة ثقيلة التكلفة، وليس لدى جميع الشركات رأس مال للذهاب فقط إلى البحث عن الابتكار، بل يجب أن تفكر في التجارة أولًا."

梁文锋:تكلفة الابتكار بالتأكيد ليست منخفضة، والارتياح السائد الذي كان يسود في الماضي مرتبط أيضًا بالوضع السابق للبلاد. ولكن الآن، نظرًا لحجم الاقتصاد الصيني وأرباح شركات مثل بايتدانس وتينسنت، فإنها ليست منخفضة على المستوى العالمي. بالتأكيد، الشيء الذي نفتقده في مجال الابتكار ليس رأس المال، بل هو نقص الثقة وعدم معرفة كيفية تنظيم كفاءة الأفراد عالية الكثافة لتحقيق الابتكار بفعالية.

“التيار الخفي”: لماذا من السهل جدا على الشركات الصينية ، بما في ذلك الشركات الكبرى التي لا تعاني من نقص في المال ، إعطاء الأولوية للتسويق السريع؟ **

Liang Wenfeng: في الثلاثين سنة الماضية، كان التركيز فقط على كسب المال وإغفال الابتكار. الابتكار ليس مدعومًا بالأعمال التجارية فقط، بل يتطلب أيضًا الفضول والرغبة في الإبداع. كنا مقيدين فقط بالعادات القديمة، لكنها أيضًا مرحلية.

“التيار الكامن”: ولكنكم في النهاية منظمة تجارية، وليست منظمة بحثية غير ربحية، فاختيار الابتكار ومشاركته بشكل مفتوح، فأين يمكن أن يكون هناك حواجز مائية؟ مثل ابتكار هيكل MLA في مايو، سيتم نسخه بسرعة من قبل الآخرين، أليس كذلك؟

Liang Wenfeng: أمام التكنولوجيا المتعددة الجوانب المهيمنة ، يكون القلعة الناتجة عن الإغلاق مؤقتة. حتى إذا أغلقت OpenAI ، فإنها لن تمنع من يتم تجاوزها بواسطة الآخرين. لذلك نحن نركز القيمة في الفريق ، حيث يحقق زملاؤنا نموًا ويكتسبون العديد من المعرفة العملية ويشكلون منظمة وثقافة قادرة على الابتكار ، وهذا هو القلعة الناتجة عنها.

المصدر المفتوح ونشر الأبحاث العلمية لا تعني فقدان شيء بالفعل. بالنسبة للمتخصصين التقنيين، يعتبر أن يتم متابعتهم إنجازًا كبيرًا. في الواقع، المصدر المفتوح يشبه أكثر سلوكًا ثقافيًا من سلوك تجاري. إعطاء الآخرين هذه الفرصة يعتبر شرفًا إضافيًا. ويمكن أن يكون لهذا الأمر جاذبية ثقافية على الشركات أيضًا.

**“التيار الداكن”: كيف ترى وجهة نظر مثل تلك التي تعتمدها السوق مثل Zhu Xiaohu؟"

梁文锋:جو تشياوهو متوازن ، لكن أسلوبه يناسب أكثر الشركات التي ترغب في كسب الأموال بسرعة ، بينما إذا نظرت إلى أكثر الشركات ربحية في الولايات المتحدة ، فستجد أنها شركات تكنولوجيا متقدمة تكون قد تراكمت ثروتها ببطء.

“التيار الكامن”: ومع ذلك، فإن إنشاء نماذج ضخمة، ليس من السهل أن يتملك الابتكار التقني البحت ميزة مطلقة، فما هو الشيء الأكبر الذي تراه في المقام الأول؟

梁文锋ما نراه هو أن الذكاء الاصطناعي في الصين لا يمكن أن يبقى دائما في موقع المتابعة. نقول في كثير من الأحيان إن هناك فارقاً بين الذكاء الاصطناعي في الصين والولايات المتحدة بفارق سنة أو سنتين، لكن الفارق الحقيقي هو الفارق بين الأصالة والتقليد. إذا لم يتغير هذا، فإن الصين ستظل دائما متبوعة فقط، ولذا فإن بعض الاستكشافات أيضا لا يمكن الهروب منها.

قيادة NVIDIA ليست جهدًا فقط من شركة واحدة ، بل هي نتيجة لجهود مشتركة لمجتمع التكنولوجيا والصناعة في الغرب. إنهم يستطيعون رؤية اتجاهات التكنولوجيا للجيل القادم ولديهم خريطة الطريق. يحتاج تطور الذكاء الاصطناعي في الصين أيضًا إلى بيئة مماثلة. العديد من تطور الرقاقات المحلية لا يمكنه التقدم بسبب نقص المجتمع التكنولوجي المرتبط. لذا ، فإن الصين بالتأكيد تحتاج إلى شخص يقف على الجبهة التكنولوجية.

زيادة الاستثمار لا تعني بالضرورة زيادة الابتكار

“التيار الكامن”: يحمل DeepSeek الحالي طابعًا مثاليًا مبكرًا لـ OpenAI وهو مفتوح المصدر. هل ستختارون الانغلاق في المستقبل؟ لقد مرت OpenAI و Mistral بعملية من الافتتاح إلى الإغلاق.

ليانغ ونفنغ: لن نغلق المصدر. نعتقد أن وجود بيئة تقنية قوية أكثر أهمية.

「暗涌」: هل لديكم خطط للتمويل؟ يبدو أن لـ 幻方 خططًا لإدراج DeepSeek كشركة مستقلة في السوق، كما ذُكر في تقرير إعلامي. شركة الذكاء الاصطناعي في سيليكون فالي، كما هو الحال دائمًا، يجب أن ترتبط بشركات كبيرة في نهاية المطاف.

Liang Wenfeng: ليس لدينا خطط للتمويل في الوقت القريب، المشكلة التي نواجهها ليست أبدًا المال، وإنما حظر الشحنات الرقاقية عالية المستوى.

**“التيار الكامن”: يعتقد الكثيرون أن القيام بالذكاء الاصطناعي العام والقيام بالتحليل الكمي هما شيآنان مختلفان تماما، يمكن أن يتم التحليل الكمي بصمت، ولكن قد يكون الذكاء الاصطناعي العام بحاجة إلى جهد كبير، وربما يحتاج إلى تحالفات، مما يمكن أن يجعل استثمارك أكبر."

Liang Wenfeng: إن الاستثمار المزيد لا يعني بالضرورة توليد المزيد من الابتكار. إلا أن الشركات الكبيرة يمكنها أن تستولي على كل الابتكارات.

“التيار الكامن”: أليس لديكم الوراثة التشغيلية الآن بسبب عدم قيامكم بتطبيقها؟

梁文锋:نعتقد أن الفترة الحالية هي فترة انفجار الابتكار التقني، وليست فترة انفجار التطبيقات. على المدى الطويل، نأمل في تشكيل بيئة، وهي استخدام الصناعة مباشرة لتقنياتنا والإخراج الخاص بنا، ونحن مسؤولون فقط عن النماذج الأساسية والابتكارات الحديثة، ثم تقوم الشركات الأخرى ببناء أعمال toB وtoC على أساس DeepSeek. إذا كان بإمكاننا تشكيل الصناعة الصناعية الكاملة، فإنه ليس من الضروري أن نقوم بتطوير التطبيقات بأنفسنا. بالطبع، إذا لزم الأمر، ليس لدينا عائق في تطوير التطبيقات، ولكن البحث والابتكار التقني سيظلان أولويتنا الأولى دائمًا.

“التيار الداكن”: ولكن إذا كنت تختار API ، فلماذا تختار DeepSeek بدلاً من الشركات الكبيرة؟

ليانغ وينفنغ: من المحتمل جدًا أن يكون العالم في المستقبل متخصصًا ومتفرعًا، حيث يحتاج النموذج الأساسي الكبير إلى الابتكار المستمر، والشركات الكبيرة لها حدود قدراتها وليست بالضرورة مناسبة.

‘الموجة السوداء’: هل يمكن حقًا أن تفصل التكنولوجيا بين الأشياء؟ لقد ذكرت أيضًا أنه لا يوجد سر تقني مطلق.

Liang Wenfeng: ليس هناك أسرار في التكنولوجيا ، لكن إعادة الضبط تستغرق الوقت والتكلفة. في نظرية البطاقات الرسومية من نفيديا ، ليس هناك أي أسرار تقنية ، ومن السهل جدًا نسخها ، ولكن إعادة تنظيم الفريق ومطاردة التكنولوجيا الجيل القادم تستغرق الوقت ، لذلك الحاجز الحقيقي لا يزال واسعًا.

**‘التحرك الكئيب’: تعكس التحرك السريع الذي قامت به شركة بيت دانس تك بعد خفض الأسعار استجابتها لتهديد محتمل. ما هو رأيك في هذه الاستراتيجية الجديدة للشركات الناشئة في المنافسة مع الشركات الكبيرة؟

ليانغ ونفينغ: صراحة، لا نهتم كثيرًا بهذه المسألة، فقط قمنا بذلك بالمرور. تقديم خدمات السحابة ليس هدفنا الرئيسي. هدفنا الأساسي هو تحقيق الذكاء الاصطناعي العام.

حتى الآن لم أر أي حل جديد، ولكن الشركات الكبيرة ليست متفوقة بشكل واضح. الشركات الكبيرة لديها مستخدمين جاهزين، ولكن أعمال التدفق النقدي لديها أيضًا عبء عليها، وهذا سيجعلها هدفًا للقلب في أي وقت.

“التدفق السري”:كيف تنظر إلى نهاية 6 شركات ناشئة كبيرة خارج DeepSeek؟

梁文锋:ربما ستبقى 2 إلى 3 شركات. الآن جميعها لا تزال في مرحلة حرق المال، لذلك تلك الشركات التي تحدد موقعها بوضوح وتقوم بتشغيل أدق لديها فرصة أكبر للبقاء على قيد الحياة. قد تتحول الشركات الأخرى بشكل جذري. الأشياء القيمة لن تختفي، ولكن ستتغير بطريقة ما.

“التيار الخفي”: في عصر الرقمية، يتم تقييم موقف التنافس على أنه “أنا أفعل ما أريد”، ونادراً ما يكون له اهتمام بالمقارنة الأفقية. بالنسبة للتنافس، ما هو نقطة البداية التي تفكر فيها؟

Liang Wenfeng: الشيء الذي أفكر فيه بانتظام هو ما إذا كان يمكن أن يزيد من كفاءة تشغيل المجتمع وما إذا كنت تستطيع أن تجد مكانًا ما في سلسلة التخصص في صناعته. طالما أن الهدف النهائي هو زيادة كفاءة المجتمع ، فإنه يكون مبررًا. هناك الكثير من المراحل في الوسط والتركيز المفرط يؤدي إلى الارتباك.

مجموعة من الشباب الذين يقومون بأعمال “غامضة ومعقدة”

“التدفق الظلامي”: يعتقد جاك كلارك، الرئيس السابق للسياسات في OpenAI وشريك مؤسس في Anthropic، أن DeepSeek قد استأجرت “مجموعة من العباقرة العميقة” لإنشاء DeepSeek v2. فمن هم هؤلاء الأشخاص؟

Liang Wenfeng: ليس هناك عباقرة عميقون وغامضون ، بل هم خريجون حديثون من الجامعات العليا ومتدربون من الصف الرابع والخامس وأشخاص شباب تخرجوا قبل بضع سنوات فقط.

“التيار السري” : العديد من شركات النماذج الكبيرة تصر على استقطاب الناس في الخارج، ويشعر الكثيرون بأن معظم أفضل 50 موهبة في هذا المجال قد لا تكون في شركات صينية، من أين يأتي الناس الذين يعملون معكم؟

Liáng Wénfēng: لا يوجد أي شخص من الخارج في نموذج V2 ، جميعهم محليون. قد يكون أفضل 50 شخصًا غير موجودين في الصين ، ولكن ربما يمكننا بناء مثل هذا الشخص بأنفسنا.

** “Undercurrent”: كيف حدث ابتكار MLA هذا؟ سمعت أن الفكرة جاءت أولا من اهتمام شخصي لباحث شاب؟ **

** Liang Wenfeng **: بعد تلخيص بعض القوانين الرئيسية لتطور هندسة الانتباه ، جاء بفكرة تصميم بديلة. ومع ذلك ، كان هناك عمل طويل من الفكرة إلى التنفيذ. لقد قمنا بتشكيل فريق لهذا الغرض ، واستغرقنا بضعة أشهر حتى نتمكن من تشغيلها.

“التدفق الظلامي”: إن ولادة هذا الإلهام المتفرع ترتبط ارتباطاً وثيقاً ببنية منظمتكم الإبداعية بالكامل. في عصر المربعات السحرية، كان من النادر عليكم تعيين الأهداف أو المهام من الأعلى إلى الأسفل. ومع ذلك، هل تزيد الجهود الإدارية في استكشافات AGI المليئة بعدم اليقين؟

ليانغ ونفنغ: ديب سيك أيضًا من الأسفل إلى الأعلى. وعادةً ما لا نقوم بتوزيع العمل مسبقًا ، بل نقوم بالتوزيع الطبيعي. لدى كل شخص تجارب نمو فريدة لنفسه ، ولديه أفكاره الخاصة ، ولا يحتاج إلى دفعه. أثناء عملية الاستكشاف ، عندما يواجه مشكلة ، سيجلب الآخرين للنقاش. ومع ذلك ، عندما يظهر فكرة معينة بإمكانياتها ، سنقوم أيضًا بتوزيع الموارد من الأعلى إلى الأسفل.

“التيار الخفي” : يُقال إن DeepSeek مرن للغاية في تجميع البطاقات والأشخاص.

** Liang Wenfeng **: ليس لدينا حدود لتحريك البطاقات والأشخاص. إذا كان لديك أفكار ، يمكن للجميع استدعاء بطاقات مجموعة التدريب في أي وقت دون الحاجة إلى موافقة. في الوقت نفسه ، بسبب عدم وجود هيكل تنظيمي وتعاون بين الأقسام ، يمكن أيضًا استدعاء الأشخاص بشكل مرن ، طالما أن الطرف الآخر مهتم.

**“التدفق السري” : نوع من الإدارة الفضفاضة يعتمد أيضًا على اختيارك لمجموعة من الأشخاص الذين يدفعهم الحب الشديد. يُقال إنكم جيدين في جذب الأشخاص من خلال التفاصيل ، بحيث يتم اختيار بعض الأشخاص المتميزين وفقًا لمعايير تقييم غير تقليدية."

Liang Wenfeng: معيار اختيارنا للأشخاص هو الحب والفضول، لذلك لدى العديد من الأشخاص تجارب غريبة ومثيرة للاهتمام. رغبة الكثير من الناس في البحث، تفوق بكثير اهتمامهم بالمال.

「暗涌」: تم إنشاء Transformer في مختبر AI التابع لشركة جوجل، في حين تم إنشاء ChatGPT في OpenAI، ما هي الفرق بين مختبرات الذكاء الاصطناعي في الشركات الكبيرة وشركة ناشئة فيما يتعلق بالقيمة التي تنشئها للابتكار؟

ليانغ ونفنغ: سواء كانت مختبرات Google أو OpenAI أو حتى مختبرات الذكاء الاصطناعي في الشركات الصينية الكبيرة ، فهي ذات قيمة كبيرة. وأخيرًا ، تم إنشاء OpenAI أيضًا بطريقة عرضية في التاريخ.

**“تيار مظلم”: هل الابتكار إلى حد كبير أيضًا نوع من الصدفة؟ أرى أنكم وضعتم أبوابًا قابلة للدفع على جانبي القاعة الكبيرة في منطقة العمل الخاصة بكم. يقول زملاؤكم إن هذا يترك الفرصة للصدفة. تشبه قصة ولادة transfomer حالات الأشخاص الذين يمرون بالصدفة وينضمون في النهاية ويحولونها إلى إطار عام."

梁文锋:أعتقد أن الابتكار في المقام الأول مسألة إيمان. لماذا لديه وادي السيليكون روح الابتكار؟ أولاً، هو يتجرأ. عندما ظهر Chatgpt، كان الناس في البلاد بأسرها يفتقرون إلى الثقة في الابتكار الرائد، من المستثمرين إلى الشركات الكبيرة، الجميع اعتقد أن الفجوة كانت كبيرة جدًا، وكان من الأفضل القيام بالتطبيقات. ولكن الابتكار يحتاج في المقام الأول إلى الثقة بالنفس. هذا النوع من الثقة عادة ما تكون أكثر وضوحًا عند الشباب.

“التيار الخفي”، لكنكم لا تشاركون في التمويل ونادراً ما تتحدثون إلى الخارج، بالتأكيد لن يكون لديكم نفس الوزن في المجتمع مثل تلك الشركات النشطة في التمويل. كيف يمكنكم التأكد من أن DeepSeek هو الخيار الأول لأولئك الذين يرغبون في بناء نماذج ضخمة؟

ليانغ ونفنغ : لأننا نقوم بأصعب الأمور. ** إن جذب أفضل العقول محقق لتحقيق أصعب المشاكل في العالم. ** في الواقع، يتم تقدير العناصر البارزة في الصين بشكل غير كافٍ. لأن هناك قلة كبيرة في الابتكار الصلب على مستوى المجتمع بأسره، مما يجعلهم لا يحصلون على الفرصة ليتم التعرف عليهم. نحن نقوم بأصعب الأمور، وهذا ما يجعلهم جاذبين لهم.

“التدفق الغامض”: لم يكن إطلاق OpenAI السابق مصحوبًا بظهور GPT5، ورأى الكثيرون أن هذا يشير إلى تباطؤ واضح في منحنى التكنولوجيا، وبدأ العديد من الأشخاص في شك القانون الخاص بالتوسيع. كيف ترون الأمر؟

Liáng wénfēng: نحن متفائلون ، ويبدو أن الصناعة بأكملها تتوافق مع التوقعات. OpenAI ليس أيضًا إلهًا ، لا يمكن أن يستمر في السباق دائمًا في الأمام.

‘التدفق الخفي’: كم يفترض بـ AGI تحقيقه بعد إصدار DeepSeek V2؟ لقد قمتم بنشر نموذج الرياضيات وإنتاج الرموز قبل إصدار الإصدار الثاني من DeepSeek، وقمتم بالتحول من النموذج الكثيف إلى MOE، فما هي إحداثيات خطة AGI الخاصة بك؟’

Liang Wenfeng: قد يستغرق الأمر عامين أو خمسة أعوام أو عشر سنوات، ومن المؤكد أنه سيتم تحقيقه خلال حياتنا. بالنسبة لخريطة الطريق، حتى داخل شركتنا، ليس هناك اتفاق موحد. ولكننا رهننا ثلاثة اتجاهات. الأول هو الرياضيات والشفرة، والثاني هو متعدد الوسائط، والثالث هو لغة الطبيعة نفسها. الرياضيات والشفرة هي حقل تجريبي طبيعي لـ AGI، مثل لعبة الجوجو، وهو نظام مغلق وقابل للتحقق، ويمكن أن يحقق ذكاءً عاليًا من خلال التعلم الذاتي. من ناحية أخرى، قد يكون من الضروري التعلم بالمشاركة في العالم الحقيقي للإنسان لـ AGI. نحن نحتفظ بكل الاحتمالات الممكنة.

「暗涌」: كيف تعتقد أن النموذج الكبير سينتهي؟

梁文锋:سيكون هناك شركات متخصصة تقدم نماذج وخدمات أساسية ، وسيكون هناك تخصص مهني طويل. المزيد من الناس سيعملون على تلبية احتياجات المجتمع المتنوعة بشكل كامل.

كل الحيل هي نتاج الجيل السابق

‘التدفق الداكن’: في العام الماضي، شهدت ريادة الأعمال في النماذج الكبيرة في الصين العديد من التغييرات، مثل الخروج المفاجئ لوانغ هويوين، الذي كان نشطًا في بداية العام الماضي، وبدأت الشركات التي انضمت لاحقًا تظهر الاختلافات.

ليانغ وينفنغ: تحمل وانغ هوي وين جميع الخسائر بنفسه، مما جعل الآخرين ينسحبون جميعًا. لقد اتخذ خيارًا غير موات لنفسه ولكنه جيد للجميع، لذلك إنه شخص كريم جدًا، وأنا أحترم هذا الجانب منه كثيرًا.

‘العاصفة المظلمة’: أين يتركز طاقتك الآن؟

梁文锋: تركيزي الرئيسي هو على دراسة النماذج الضخمة للجيل القادم. هناك العديد من المشكلات التي لم يتم حلها بعد.

‘الاندفاع الداكن’: يصر العديد من شركات النموذج الكبيرة على الاستمرار في الحصول على الجودة والكمية في وقت واحد، لأن التكنولوجيا لا تؤدي إلى تفوق دائم، والتركيز على تحويل الفوائد التقنية إلى منتجات في الوقت المناسب أمر مهم أيضًا. هل DeepSeek يركز على البحث في النماذج لأن قدرة النماذج لا تزال غير كافية؟’

Liang Wenfeng: جميع الاستراتيجيات هي نتاج الجيل السابق ، وقد لا تتحقق في المستقبل. مناقشة نماذج ربح المستقبل للذكاء الاصطناعي باستخدام منطق الأعمال على الإنترنت ، مثل النقاش عن جنرال إلكتريك وكوكا كولا عندما كانت ما تزال في بداية العمر ، ربما يكون هذا طريقة للبحث عن السيف المفقود أثناء قطع النهر.

“التيار الظلامي”: في الماضي ، كانت هناك جينات قوية للتكنولوجيا والابتكار في المربع السحري ، وكان النمو نسبيًا سلسًا. هل هذا هو سبب تفاؤلك الزائد؟

Liang Wenfeng: إلى حد ما، تعزز الرقم السحري ثقتنا في الابتكار المدفوع بالتكنولوجيا، لكنه ليس دائمًا سهلًا. لقد مررنا بعملية تراكمية طويلة. ما يراه الناس من الخارج هو جزء من الرقم السحري بعد عام 2015، ولكننا قمنا بذلك على مدار 16 عامًا.

**“التيار الظلامي”: العودة إلى موضوع الابتكار الأصلي. الآن يبدأ الاقتصاد في الانتقال إلى الهبوط ، والرأسمالية تدخل أيضًا في دورة باردة ، فهل ستؤدي إلى مزيد من القمع فيما يتعلق بالابتكار الأصلي؟

梁文锋:أعتقد أنه قد لا يكون بالضرورة. ستعتمد تعديل هيكل الصناعة الصينية بشكل أكبر على الابتكار التقني الصلب. عندما يدرك الكثيرون أن الربح السريع في الماضي ربما كان نتيجة لحظة من الحظ، سيكونون أكثر عرضة للانحناء للقيام بابتكار حقيقي.

“المد والجزر”: هل أنت متفائل أيضًا بهذا الأمر؟

** ليانغ ون فنغ **: لقد نشأت في مدينة من الدرجة الخامسة في قوانغدونغ في 80s. كان والدي مدرسا في مدرسة ابتدائية ، وفي 90s ، كانت هناك العديد من الفرص لكسب المال في قوانغدونغ ، وجاء العديد من الآباء إلى منزلي في ذلك الوقت ، وذلك أساسا لأن الآباء شعروا أن القراءة كانت عديمة الفائدة. لكن إذا نظرنا إلى الوراء الآن ، فقد تغير التصور. نظرا لأن المال ليس من السهل كسبه ، فقد تضيع حتى فرصة قيادة سيارة أجرة. لقد تغير زمن جيل.

في المستقبل، ستزيد الابتكارات الصلبة بشكل متزايد. قد لا يكون من السهل فهمها الآن، وذلك لأن المجتمع بأسره بحاجة إلى التثقيف بالحقائق. عندما يحقق الأشخاص الذين يبتكرون بشكل صلب النجاح، ستتغير أفكار المجتمع بشكل جماعي. نحن بحاجة فقط إلى الحقائق وعملية واحدة.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات