著者: Yu Lili; ソース: Dark Waves****
中国の7つの大規模モデルスタートアップ企業の中で、DeepSeek(深度求索)は最も控えめですが、それでも意外な方法で人々に覚えられることがあります。
一年前、この意外な事態は、その背後にある量子プライベートエクイティの巨大な存在ファンファンによるものであり、彼ら以外にはA100チップを万枚保有している唯一の外部大手企業でした。1年後には、中国の大規模モデル価格競争の引き金となる存在になりました。
AIによる連続攻撃を受けた5月、DeepSeekは一躍有名になりました。その理由は、彼らがリリースしたDeepSeek V2というオープンソースモデルにあり、これは前代未聞のコストパフォーマンスを提供しています:推論コストは100万トークンあたりわずか1ドルにまで引き下げられ、Llama3 70Bの7分の1、GPT-4 Turboの70分の1に相当します。
DeepSeekはすぐに「AI界の拼多多」と呼ばれるようになり、バイト、テンセント、バイドゥ、アリババなど大手も我慢できずに値下げしました。中国の大規模モデルの価格戦争が始まりました。
**この煙は、補助金を出すためにお金を燃やす多くの大規模工場とは異なり、DeepSeekが利益を上げているという事実を実際に覆い隠しています。 **
その背後には、DeepSeekがモデルアーキテクチャにおいて革新的なアプローチを取っています。DeepSeekは、新しいマルチヘッド潜在的注意メカニズム(MLA)アーキテクチャを提案し、メモリ使用量を従来の最も一般的なMHAアーキテクチャの5%〜13%に減らしました。同時に、DeepSeekの独自のDeepSeekMoESparse構造も計算量を極限まで減らしました。これらの要素が最終的にコスト削減につながりました。
シリコンバレーでは、DeepSeekは「東洋からの神秘的な力」と呼ばれています。SemiAnalysisの最高分析者は、DeepSeek V2論文が「今年最高の論文かもしれない」と考えています。OpenAIの元従業員であるAndrew Carrは、その論文が「驚くべき知恵に満ちている」と述べ、自身のモデルにそのトレーニング設定を適用しました。また、OpenAIの元ポリシーディレクターであり、Anthropicの共同創設者であるJack Clarkは、DeepSeekが「深遠で不可解な才能を雇用している」と考え、中国製の大規模モデルが「ドローンや電気自動車と同様に無視できない力になる」とさらに述べました。
**基本的には、AIの波においてシリコンバレーの物語が進展している中で、これは珍しい状況です。**複数の業界関係者によれば、この強い反響は、アーキテクチャのレベルでのイノベーションから生まれており、国内の大規模モデル企業やグローバルなオープンソースの基盤モデルとは異なる試みであると言えます。**あるAI研究者は、Attentionアーキテクチャが何年もの間提案されてきたが、ほとんど成功した改善はなく、大規模な検証はなされていないと述べています。「これは多くの人が自信を持っていないため、意思決定する際にも打ち切られる可能性がある考えです。」
一方、国内の大型モデルは、過去にはほとんどアーキテクチャレベルの革新に関与していなかった。これは、**米国が0から1への技術革新に長けており、中国が1から10への応用革新に長けているという見解を打破する人がほとんどいなかったためでもある。**さらに、このようなアプローチは非常に得策ではない。新世代のモデルは数か月で開発されるため、中国企業は単に追随し、アプリケーションをよりよくすればよい。モデル構造に革新をもたらすことは、明確な経路がないことを意味し、多くの失敗を経験し、多大な時間と経済的コストがかかることを意味する。
DeepSeekは明らかに逆行者です。大規模モデル技術は必ずしも同じ方向に向かうと考えられている中で、フォローすることがより賢い近道であるという騒々しい声の中で、DeepSeekは「曲がり角」で蓄積された価値を重視し、中国の大規模モデルの起業家が革新的なアプリケーションに加えて、グローバルな技術革新の流れに参加することもできると考えています。
DeepSeekの多くの決定は他とは異なっています。中国の大規模モデルのスタートアップ7社の中で、彼らは「要も要まらず」の方針を放棄した唯一の会社で、現在でも研究と技術に特化し、toCアプリを提供していません。また、ビジネス化を全面的に考慮せず、むしろオープンソースの道を堅く選択し、資金調達も一切行っていません。これらのことから、彼らはしばしば牌卓の外に忘れられがちですが、一方で、コミュニティ内ではユーザーによって「自家製の水」のように広まっています。
DeepSeekはどのようにして作られたのですか?我々はほとんど表舞台に出ていないDeepSeekの創始者である梁文鋒にインタビューしました。
幻方時代から、技術に打ち込んできた80年代の創設者は、DeepSeek時代でもその控えめなスタイルを続けています。彼は他の研究者と同様に、毎日「論文を読み、コードを書き、グループディスカッションに参加する」という日々を送っています。
多くの量子ファンドの創設者は海外のヘッジファンドの経歴を持っていますが、物理学や数学などの専門分野出身者とは異なり、梁文锋は常に国内の背景を持っており、若い頃は浙江大学の電子工学部で人工知能の方向を学んでいました。
複数の業界関係者やDeepSeekの研究者は、梁文鋒は現在の中国のAI界において非常にまれな「強力なinfraエンジニアリング能力とモデル研究能力を兼ね備え、リソースを動員できる」と評価しています。また、彼は「高い位置から正確な判断を下すことができ、一線の研究者よりも詳細な部分で優れている」とも言われており、「恐ろしい学習能力」を持っている一方で、「老板のようなものではなく、むしろギークのような存在」とも評されています。
これは非常に貴重なインタビューです。このインタビューでは、この技術理想主義者は、中国の科学技術界で非常に稀少な一種の声を提供しています:彼は「是非の観点」を「利害の観点」よりも優先し、時代の慣性を認識し、創造的な革新を日程に乗せることを我々に思い起こさせる数少ない人物です。
1年前、DeepSeekが初めて登場したとき、私たちは梁文峰氏と初めて会話しました:「狂気の魔方陣:透明なAI巨大企業の大型モデルの道のり」。当時の**「狂気に満ちた野心を抱くことが重要であり、狂気に満ちた誠実さも重要である」**という言葉が美しいスローガンであったとしたら、1年が経過し、それは行動に移されつつあります。
以下は対話の一部です
「暗涌」:DeepSeek V2モデルのリリース後、急速に血の雨を引き起こす大規模な価格戦争が勃発し、ある人はあなたたちが業界のナマズだと言います。
梁文锋:私たちはナマズになるつもりはなかったのですが、うっかりナマズになってしまいました。
「暗涌」:この結果は予想外でしたか?
Liang Wenfeng: 非常に予想外でした。 この値段でみんながこんなに敏感になるとは思っていませんでした。 自分たちのペースでやって、コストを計算するだけです。 私たちの原則は、お金を割り引かないことであり、莫大な利益を上げることもありません。 この価格も、コストに加えて少しの利益です。
「暗涌」:5日後には、Zhipu AIが追いつき、その後はバイトダンス、アリババ、バイドゥ、テンセントなどの大手企業が続きます。
梁文锋:智谱AI降的は初心者向けの製品で、同じレベルのモデルはまだとても高価です。バイトダンスは本当に最初に追随しました。フラグシップモデルの価格を私たちと同じに引き下げ、他の大手企業も次々に価格を下げました。大手企業のモデルのコストは私たちよりもはるかに高いため、誰かが損をしてこのことをするとは思いませんでした。最終的には、インターネット時代のお金を投入して補助する論理になりました。
「暗涌」:外部から見ると、値下げはユーザーを奪い合うようなものであり、インターネット時代の価格戦争は通常、このようなものです。
梁文锋:ユーザーを奪うことは私たちの主な目的ではありません。私たちが価格を引き下げるのは、次世代モデルの構造を探求しているためであり、コストがまず下がってきたからです。また、APIもAIも、誰もが利用できる普及品でなければならないと考えています。
「暗涌」:これまで、多くの中国企業はこの世代のLlamaの構造を直接コピーしてアプリケーションを作っていましたが、なぜあなたたちはモデルの構造から入るのですか?
梁文锋:もしアプリケーションを作ることが目標なら、Llamaの構造を引き継ぎ、素早く製品をリリースすることも合理的な選択です。しかし、私たちの目標はAGIです。これはより強力なモデル能力を実現するために、限られたリソースの中で新しいモデル構造を研究する必要があることを意味します。これは、より大規模なモデルにスケールアップするために行う基礎的な研究の一部です。モデル構造に加えて、私たちはデータの構築方法やモデルをより人間らしくする方法など、多くの他の研究も行っています。これらは私たちがリリースしたモデルに反映されています。また、Llamaの構造は、トレーニング効率と推論コストの面で、国外の先進レベルとは2世代の差があると推定されています。
「暗涌」:このスプレッドは主にどこから来ていますか?
梁文锋:まず、トレーニングの効率には差があります。国内の最高水準と国外の最高水準を比較すると、モデルの構造とトレーニングダイナミクスにはおそらく2倍の差があると推測されます。そのため、同じ効果を得るためには、2倍の計算能力を消費する必要があります。さらに、データの効率にも2倍の差がある可能性があり、つまり、同じ効果を得るためには、2倍のトレーニングデータと計算能力を消費する必要があります。合わせて、4倍の計算能力を消費する必要があります。私たちが行うべきことは、これらの差を縮小し続けることです。
「暗涌」:多くの中国企業はモデルとアプリケーションの両方を選択する傾向にありますが、DeepSeekは現在、研究と探索のみに取り組むことを選択しています。
梁文锋:私たちの考えでは、今最も重要なのは、世界のイノベーションの波に参加することです。過去数年間、中国企業は技術革新を他人に任せ、それを持ち帰りアプリケーションに転換してきましたが、それは当然のことではありません。この波に乗るにあたり、私たちの出発点はただ利益を得ることではなく、技術の最先端に立ち、生態系全体の発展を推進することです。
「暗涌」:インターネットとモバイルインターネット時代に大多数の人々が持つ慣性的な認識は、アメリカが技術革新を行うのに長けている一方、中国はアプリケーションを作るのに長けているというものです。
梁文锋:経済の発展とともに、**中国も徐々に貢献者になる必要があると考えています。絶えず他人の助けを借りるだけではありません。**過去30年以上のITブームの中で、私たちは技術革新にほとんど参加していませんでした。私たちはモアの法則が空から降ってくることに慣れており、18ヶ月後にはより優れたハードウェアとソフトウェアが出てくるということです。Scaling Lawも同様に扱われています。
しかし、実際には、これは西洋主導の技術コミュニティが世代を重ねて創造したものであり、私たちはこのプロセスに参加していなかったため、その存在を無視していました。
「暗涌」:なぜDeepSeek V2はシリコンバレーの多くの人々を驚かせるのか?
梁文锋:アメリカで日々起こっている多くのイノベーションの中で、これは非常に一般的なものです。彼らが驚いた理由は、これが中国の会社であるためであり、イノベーションの貢献者として彼らのゲームに参加しているからです。つまり、ほとんどの中国企業はフォローすることに慣れており、イノベーションをするのではありません。
「暗涌」:しかし、このような選択肢を中国の文脈でするのはあまりにも贅沢です。ビッグモデルは再投資のゲームであり、すべての企業が革新を研究するための資本しか持たず、ビジネス化を先に考えていないわけではありません。
Liang Wenfeng: イノベーションのコストは決して低くはなく、過去の惰性は過去の国情にも関係しています。 しかし、中国の経済規模にせよ、バイトやテンセントなどの大企業の利益にせよ、世界でも低くないことがわかります。 イノベーションに欠けているのは、間違いなく資本ではなく、自信の欠如と、効果的なイノベーションを達成するために高密度の人材を組織する方法を知らないことです。
**「潜在的な波」:なぜ中国企業- お金に不自由しない大手企業も- が迅速な商業化を第一の要請とするのはなぜですか?」
梁文锋:過去30年間、私たちはお金を稼ぐことにのみ重点を置いてきましたが、イノベーションについては無視していました。イノベーションは完全にビジネスドライブのものではなく、好奇心と創造欲も必要です。私たちは過去の慣性に縛られていただけですが、これも一時的なものです。
「暗涌」:しかし、あなたたちは商業組織であり、公益科学研究機関ではありません。イノベーションを選択し、オープンソースで共有することで、どこで城壁を形成するのですか?5月のMLAアーキテクチャのイノベーションもすぐに他の企業にコピーされるでしょうか?
梁文锋:革命的な技術の前では、閉鎖された形式で形成された城壁は一時的なものに過ぎません。OpenAIが閉鎖されていても、他者に追い越されることを防ぐことはできません。したがって、私たちは価値をチームに蓄積し、同僚たちはこのプロセスで成長し、多くの知識を蓄積し、革新的な組織と文化を形成することができます。これが私たちの城壁です。
オープンソース、論文を発表することは、実際には何も失われていません。技術者にとっては、フォローされることは非常に達成感があることです。実際、オープンソースはビジネス行為ではなく、むしろ文化的な行為です。与えることは一種の名誉です。会社がこれを行うことは、文化的な魅力も持っています。
「暗涌」:朱啸虎などのこの種の市場信仰派の観点についてどのようにお考えですか?
梁文锋:朱啸虎は自己整合的だが、彼のプレイスタイルは速くお金を稼ぐ企業に適していますが、アメリカで最も利益を上げている企業を見ると、それらは蓄積している高い技術企業です。
「暗涌」:大規模なモデルを作ることは技術的にもリードすることが難しく、絶対的な優位性を形成するのも難しいです。あなたが賭けている大きなものは何ですか?
梁文锋:**私たちが見ているのは、中国のAIが常に追従の立場にいるわけではないということです。**中国のAIはアメリカとは1〜2年の差があるとよく言われますが、実際のギャップはオリジナルと模倣の違いです。この点が変わらない限り、中国は常に追従者になるだけであり、いくつかの探索も逃れることはできません。
NVIDIAのリードは、1つの企業の努力だけでなく、西洋の技術コミュニティと産業が共同で努力した結果です。彼らは次世代の技術トレンドを見て、ロードマップを手にしています。中国のAIの発展には、このようなエコシステムが必要です。多くの国産チップが発展しないのは、技術コミュニティが不足しているためであり、二次情報しか持っていないためです。そのため、中国には技術の最前線に立つ人が必要です。
「暗涌」:DeepSeekは現在、初期の理想主義の雰囲気を持ち、オープンソースのプロジェクトです。将来的にはクローズドソースに移行する予定はありますか?OpenAIとMistralもオープンソースからクローズドソースへの移行を経験しています。
リャン・ウェンフォン:私たちはクローズドソースにはしません。私たちは強力なテクノロジーエコシステムを持つことがより重要だと考えています。
「暗涌」:あなたたちは資金調達計画を持っていますか?メディアによると、幻方はDeepSeekの独立した分割上場計画を持っており、シリコンバレーのAIスタートアップ企業も最終的には大手企業との結びつきを避けることはできません。
Liang Wenfeng:短期的な資金調達計画はなく、私たちが直面している問題は決してお金ではなく、ハイエンドチップの禁輸です。
「暗涌」:多くの人が、AGIと量子化はまったく異なる2つのことだと考えています。量子化は静かに行うことができますが、AGIには同盟が必要で、投資を増やすことができます。
梁文锋:より多くの投資が必ずしもより多くのイノベーションをもたらすとは限りません。そうであれば、大手企業はすべてのイノベーションを独占してしまうことができます。
**「暗涌」: 今のあなたたちはアプリをしないのは、運営の遺伝子がないからですか?」
梁文锋:現在の段階は技術革新の爆発期であり、アプリケーションの爆発期ではないと考えています。長期的には、業界が私たちの技術と成果を直接利用し、私たちは基本モデルと先端のイノベーションに責任を持ち、他の企業がDeepSeekを基盤にBtoB、BtoCのビジネスを構築するエコシステムを形成したいと考えています。もし完全な産業の上流と下流を形成できれば、自分たちでアプリケーションを作る必要はありません。もちろん、必要ならアプリケーションを作ることにも障害はありませんが、研究と技術革新は常に私たちの第一の優先事項です。
「暗涌」:しかし、APIを選択する場合、なぜ大手ではなくDeepSeekを選択するのですか?
梁文锋:将来の世界は専門化された分業になる可能性が非常に高いです。基礎的な大型モデルは継続的なイノベーションが必要であり、大企業にはその能力の限界があり、必ずしも適しているわけではありません。
「アンチョン」:しかし、技術だけで差をつけることは本当にできるのでしょうか?あなたも絶対的な技術秘密は存在しないと言いました。
梁文锋:技術には秘密はありませんが、リセットには時間とコストがかかります。 NVIDIAのGPUには理論上技術的な秘密はありませんが、チームを再編成し、次世代技術に追いつくには時間がかかるため、実際の競争上の優位性は非常に広いです。
「暗涌」:あなたたちが値下げした後、バイトは先んじて追随したことから、彼らはまだある種の脅威を感じているということです。スタートアップ企業と大手メーカーの競争についてどう思いますか?
梁文锋:正直に言って、私たちはこのことにあまり気を配っていません。ちょうどこのことをやっているだけです。クラウドサービスの提供は私たちの主要な目標ではありません。私たちの目標は依然としてAGIの実現です。
現在、新しい解決策は見当たりませんが、大手企業も明らかに優位ではありません。大手企業は既存のユーザーを持っていますが、現金流事業も彼らの負担であり、いつでも転覆される可能性があります。
「暗涌」:DeepSeek以外の6つの大規模モデルスタートアップ企業の最終結末をどのように見ていますか?
梁文锋:2から3社が生き残る可能性があります。現在、すべてがお金を燃やす段階にありますので、自己の位置づけが明確で、より細かい運営ができる企業の方が生き残るチャンスがあります。他の会社は再生するかもしれません。価値のあるものは消えることはありませんが、形が変わるかもしれません。
「暗涌」:幻方时代,競争に直面する姿勢は「独自の道を行く」と評価され、横の比較にあまり注意を払わない。競争について、あなたが考える原点は何ですか?
梁文锋:私が常に考えているのは、あるものが社会の運営効率を高めることができるかどうか、そしてその産業分業の中で自分の得意な位置を見つけられるかどうかです。社会の効率を高めることが最終目標であれば、それは正当なことです。途中で多くのことは段階的であり、過度の注意は必ず混乱を招きます。
**「底流」:OpenAIの元ポリシー責任者であり、Anthropicの共同創設者であるジャック・クラークは、DeepSeekが「計り知れない魔法使いのグループ」を雇ったと考えていますが、DeepSeek v2を作ったのはどのような人々ですか? **
梁文锋:特に謎めいた天才はいません。彼らはすべて、一流大学の卒業生、博士課程の途中である学生、博士課程を終えていないインターン、そして数年間の若者です。
「暗涌」: 多くの大手モデル会社が海外で人材を探し求めているが、多くの人々は、この分野のトップ50の人材は中国の会社にはいないかもしれないと考えています。あなた方の人材はどこから来ていますか?」
梁文锋:V2モデルには海外から戻ってきた人はいません。前50人のトップ人材は中国にいないかもしれませんが、私たち自身でそのような人材を育成できるかもしれません。
「暗涌」:このMLAのイノベーションはどのようにして起こったのですか?アイデアは最初に若い研究員の個人的な興味から来たと聞いていますか?
梁文锋:Attentionアーキテクチャのいくつかの主要な変遷規則をまとめた後、彼は代替案を設計しようと思い立った。しかし、アイデアから実現まで、その過程は非常に長いものでした。私たちはそのためにチームを結成し、数ヶ月かかってようやく実現させました。
**「暗涌」:このような拡散的なインスピレーションの誕生は、あなた方の革新的な組織の構造と密接な関係があります。幻方時代、上から下への目標やタスクの割り当てはほとんどありませんでしたが、AGIのような不確実性に満ちた最先端の探求には、管理行為が多すぎるのでしょうか?」
梁文锋:DeepSeekも全てがボトムアップです。そして通常、私たちは上から分業を行うのではなく、自然に分業を行います。それぞれが独自の成長経験を持っており、自分の考えを持っているため、彼らを押す必要はありません。探索の過程で問題に直面した場合、彼ら自身が人々を集めて議論を行います。ただし、あるアイデアが潜在能力を示すと、リソースを配分するためにトップダウンで行動することもあります。
「暗涌」:DeepSeekはカードと人の調整に非常に柔軟であると聞いています。
梁文锋:私たちは、カードと人員の移動に上限は設けていません。アイデアがある場合は、トレーニングクラスターのカードを承認なしで自由に使用できます。また、階層や部門を超えて柔軟に他の人を呼び出すこともできます。相手が興味がある場合はどなたでも呼び出すことができます。
「暗涌」:緩やかな管理スタイルは、熱狂的な人々を選別することにも依存しています。あなたたちは、非伝統的な評価基準に優れた人々を見つけるのが得意だと聞いています。
Liang Wenfeng:人を選ぶ基準は常に愛と好奇心だったので、多くの人が奇妙な経験をしますが、それは非常に興味深いことです。 多くの人は、お金を気にするよりも、研究をすることにはるかに熱心です。
「アンチョン」:トランスフォーマーはGoogleのAI Labで誕生し、ChatGPTはOpenAIで誕生しました。あなたは、大手企業のAI Labとスタートアップ企業がイノベーションにどのような価値を生み出すかについてどのように考えていますか?
梁文锋:Googleの研究所、OpenAI、そして中国の大手企業のAI Labはすべて価値があります。最終的にOpenAIが成功したのは、歴史的な偶然性もあります。
**「暗涌」:革新は大いに偶然でもあるのでしょうか?私は、あなた方のオフィスの中央に配置された会議室の両側に自由に押し開けることができるドアがあるのを見ました。同僚たちは、これは偶然のための余地を残すためだと言っています。transformerの誕生は、偶然に出会った人が参加し、最終的には一般的なフレームワークになったという物語です。」
梁文锋:私はイノベーションはまず信念の問題だと考えています。なぜシリコンバレーはそんなにイノベーション精神があるのでしょうか?まずは勇気があるからです。Chatgptが登場したとき、国内全体が先端技術のイノベーションに自信を持っていなかったです。投資家から大手メーカーまで、差が大きすぎると感じていて、やはりアプリを作るべきだと考えていました。しかし、イノベーションにはまず自信が必要です。この種の自信は通常、若者により顕著に現れます。
「闇流れ」:ただし、あなたたちは資金調達に参加しないため、外部でほとんど発言せず、社会的な影響力では、資金調達が活発な企業よりも明らかに劣るが、DeepSeekがモデル構築者の選択肢であることをどのように保証するのですか?
梁文锋:私たちは最も難しいことに取り組んでいるからです。**トップクラスの人材を引き付ける最大の魅力は、世界で最も難しい問題を解決することです。**実際、中国ではトップクラスの人材が過小評価されています。社会全体でのハードコアイノベーションが非常に少ないため、彼らが認識される機会がありません。私たちは最も難しいことに取り組んでおり、彼らにとって魅力的です。
「アング」:最近、OpenAIのリリースがGPT5をもたらさなかったため、多くの人が技術の曲線が明らかに減速していると感じ、多くの人がスケーリング・ローに疑問を投げかけ始めています。あなたたちはどう思いますか?
梁文锋:私たちは楽観的です。全体として、産業全体が予想通りのようです。OpenAIも神ではありません。常に先頭を走り続けることはできません。
「暗涌」:AGIが実現するにはまだ時間がかかると思います。DeepSeek V2をリリースする前に、コード生成と数学モデルのリリースもあり、denseモデルからMOEに切り替えたことから、あなたのAGIのロードマップにはどのようなポイントがありますか?
梁文锋:2年、5年、または10年後、私たちの生涯の間に実現するでしょう。 ロードマップについては、私たちの会社の内部でも意見が一致していません。 しかし、私たちは確かに3つの方向に賭けています。 数学とコード、多モード、自然言語そのものです。 数学とコードはAGIの自然な実験場であり、囲碁のようなものです。 これは閉鎖的で検証可能なシステムであり、自己学習によって高度な知能を実現する可能性があります。 一方、多モードは人間の実世界に参加し、AGIにとっても必要です。 私たちはすべての可能性に対してオープンな姿勢を保っています。
**「暗涌」:あなたは大規模モデルの最終局面がどのようなものだと思いますか?」
梁文锋:専門企業が基本モデルと基本サービスを提供し、専門的な分業の長い連鎖が生まれます。多くの人々がその上に立ち、社会全体の多様なニーズを満たすことになります。
「暗涌」:過去この1年間、中国の大規模なモデル起業は多くの変化がありました。例えば、昨年は非常に活発だった王慧文が中途で脱退し、後に参加した企業も異なる特徴を示し始めました。
梁文锋:王慧文は全ての損失を自ら負担し、他の人々にはすべてが無事に終わるようにしました。彼は自分にとって最も不利でありながら、みんなのためになる選択をしました。だから彼の人柄にはとても感服しています。
「暗涌」:今、あなたのエネルギーは一番どこに集中していますか?
梁文锋:主なエネルギーは次世代の大規模モデルの研究に注がれています。 まだ解決されていない問題はたくさんあります。
「暗涌」: 他のいくつかの大規模なモデルスタートアップ企業は、技術が永続的なリードをもたらすことはないため、技術的な優位性を製品に落とし込むことが重要です。DeepSeekはモデルの研究に特化する勇気を持っているということですか?
梁文锋:すべての手法は前の世代の産物であり、将来必ずしも成立するわけではありません。インターネットのビジネスロジックを使って将来のAIの収益モデルを議論するのは、当時馬化腾が起業したときに一般電気やコカ・コーラを議論するのと同じです。おそらく舟を剣と間違えることになります。
**「暗涌」:過去、幻方は非常に強力な技術とイノベーションの遺伝子を持っており、成長も比較的スムーズに進んできました。これがあなたが楽観的な理由ですか?」
梁文锋:幻方はある意味で技術駆動型イノベーションへの信頼を高めるものですが、全てが順調ではありません。我々は長い時間をかけて蓄積してきました。外部では2015年以降の一部が見られますが、実際には16年間取り組んできました。
「暗涌」:原創的創新に関する話題に戻ります。経済が下降局面に入り、資本も冷え込み始めている今、これは原創的なイノベーションにさらなる抑制をもたらすでしょうか?
梁文锋:私は必ずしもそうは思いません。中国の産業構造の調整は、よりハードテクノロジーのイノベーションに依存することになるでしょう。多くの人々が過去の急激な利益が時代の運による可能性が高いことに気づいたとき、本当のイノベーションに取り組むことをより望むようになるでしょう。
「暗潮」:なので、あなたもこのことに楽観的ですか?
梁文锋:私は80年代に広東の五線都市で育ちました。父は小学校の先生でしたが、90年代には広東で多くの稼ぎの機会がありました。当時、多くの親が私の家にやってきましたが、基本的には学校に行くことは無駄だと考えていました。しかし、今では考え方が変わりました。お金を稼ぐのが難しくなったため、タクシーを運転する機会さえもなくなるかもしれません。一世代が変わりました。
将来、ハードコアなイノベーションがますます増えるでしょう。今は理解されにくいかもしれませんが、それは社会全体が事実によって教育される必要があるからです。この社会がハードコアなイノベーションの人々を成功させると、集団的な考え方が変わるでしょう。私たちはただ多くの事実と過程が必要です。