Chỉ Bộc, Mặt tối của mặt trăng, cuộc họp bàn tròn cùng Xiaomi: Mô hình lớn thực sự bắt đầu "làm việc", sức mạnh tính toán vẫn là trở ngại lớn nhất

Tác giả: Trần Quân Đạt

智东西 3月 27 日报道,今天,在中关村论坛上,智谱 CEO 张鹏、月之暗面 CEO 杨植麟(担任主持)、小米 MiMo 大模型负责人罗福莉、无问芯穹 CEO 夏立雪和香港大学助理教授黄超罕见同台,进行了一场围绕开源大模型与智能体未来走向的深度对话。

Báo cáo vào ngày 27 tháng 3 của Zhizhong Dongxi cho biết, hôm nay, tại Diễn đàn Trung Quan Đường, CEO của Zhizhu Zhang Peng, CEO của Mặt Trăng Tối Yang Zhilin (đảm nhiệm vai trò dẫn chương trình), người phụ trách mô hình lớn MiMo của Xiaomi Luo Fuli, CEO của Wu Wen Xing Qiong Xia Lixue và trợ lý giáo sư Đại học Hong Kong Huang Chao hiếm khi cùng nhau xuất hiện, thực hiện một cuộc đối thoại sâu sắc về tương lai của mô hình lớn mã nguồn mở và các tác nhân thông minh.

这场对话以当下最火的 OpenClaw 切入,几位嘉宾一致认为,智能体让大模型真正开始“干活”了。OpenClaw 可扩展大模型的能力边界,但也对模型提出了更高要求,智谱正研究长程规划、自我调试等能力,而罗福莉的团队更关注通过架构创新把成本降下来、速度提上去,甚至实现模型自进化。

Cuộc đối thoại này bắt đầu từ OpenClaw đang hot nhất hiện nay, các khách mời đều nhất trí cho rằng, tác nhân thông minh đã thực sự giúp mô hình lớn bắt đầu “làm việc”. OpenClaw mở rộng biên giới khả năng của mô hình lớn, nhưng cũng đặt ra yêu cầu cao hơn cho mô hình, Zhizhu đang nghiên cứu khả năng lập kế hoạch dài hạn, tự điều chỉnh, trong khi đội ngũ của Luo Fuli tập trung vào việc giảm chi phí và tăng tốc độ thông qua đổi mới cấu trúc, thậm chí đạt được sự tự tiến hóa của mô hình.

基础设施也得跟上智能体的节奏。夏立雪认为现在的算力系统和软件架构还是给人用的,不是给智能体用的,其实是用人的操作能力限制了 Agent 的发挥空间。因此,我们需要打造 Agentic Infra。

Hạ Lịch Tuyết cho rằng cơ sở hạ tầng cũng cần theo kịp nhịp độ của các tác nhân thông minh. Bà cho rằng hệ thống tính toán và kiến trúc phần mềm hiện tại vẫn phục vụ cho con người, không phải cho các tác nhân thông minh, thực tế là khả năng vận hành của con người đã hạn chế không gian phát huy của tác nhân. Do đó, chúng ta cần xây dựng Cơ sở hạ tầng Tác nhân.

在多位嘉宾眼中,开源是推动大模型与智能体发展的核心动力之一。香港大学助理教授黄超便认为,开源生态的繁荣是智能体从“玩一玩”走向真正“打工人”的关键,只有通过社区共建,才能让软件、数据和技术全面转向智能体原生形态,最终形成可持续的全球 AI 生态。

Trong mắt nhiều khách mời, mã nguồn mở là một trong những động lực chính thúc đẩy sự phát triển của mô hình lớn và các tác nhân thông minh. Trợ lý giáo sư Đại học Hong Kong Huang Chao cho rằng, sự thịnh vượng của hệ sinh thái mã nguồn mở là chìa khóa để các tác nhân thông minh từ “chơi một chút” chuyển sang “lao động” thực sự, chỉ thông qua việc cùng xây dựng cộng đồng, phần mềm, dữ liệu và công nghệ mới có thể chuyển hoàn toàn sang hình thức bản địa của tác nhân, cuối cùng hình thành một hệ sinh thái AI toàn cầu bền vững.

此外,几位嘉宾还就大模型涨价、token 用量爆发、AI 未来 12 个月的关键词等话题,展开讨论。以下是这场圆桌论坛的核心观点:

Ngoài ra, một số khách mời cũng đã thảo luận về việc tăng giá mô hình lớn, bùng nổ lượng token, từ khóa AI trong 12 tháng tới và các chủ đề khác. Dưới đây là những quan điểm chính của diễn đàn bàn tròn này:

1、张鹏:模型变大后推理成本也会相应提高,近期智谱的涨价策略其实是回归到正常的商业价值上了,长期低价竞争不利于行业发展。

  1. Zhang Peng: Khi mô hình lớn hơn, chi phí suy luận cũng sẽ tăng tương ứng, chiến lược tăng giá gần đây của Zhizhu thực sự là trở về giá trị thương mại bình thường, cạnh tranh giá thấp lâu dài không có lợi cho sự phát triển của ngành.

2、张鹏:智能体等新技术的爆发让 token 用量增长了 10 倍,但实际需求可能增长 100 倍,仍有大量需求未被满足,因此算力仍然是未来 12 个月内的关键问题。

  1. Zhang Peng: Sự bùng nổ của các công nghệ mới như tác nhân thông minh đã khiến lượng token tăng gấp 10 lần, nhưng nhu cầu thực tế có thể tăng gấp 100 lần, vẫn còn nhiều nhu cầu chưa được đáp ứng, vì vậy sức mạnh tính toán vẫn là vấn đề quan trọng trong 12 tháng tới.

3、罗福莉:从基座大模型厂商的视角来看,OpenClaw 保证了基础大模型的下限,拉高了上限。国产开源模型+OpenClaw 的任务完成度已经非常接近 Claude。

  1. Luo Fuli: Từ góc nhìn của nhà sản xuất mô hình lớn cơ sở, OpenClaw đảm bảo giới hạn dưới của mô hình lớn cơ sở, nâng cao giới hạn trên. Độ hoàn thành nhiệm vụ của mô hình mã nguồn mở nội địa + OpenClaw đã rất gần với Claude.

4、罗福莉:DeepSeek 给国内大模型厂商带来了勇气和信心。一些看似是“为了效率妥协”的模型结构创新引发了真正的变革,让业界在算力一定的情况下发挥出最高的智能水平。

  1. Luo Fuli: DeepSeek đã mang lại cho các nhà sản xuất mô hình lớn trong nước sự can đảm và tự tin. Một số đổi mới cấu trúc mô hình dường như là “thỏa hiệp vì hiệu quả” đã gây ra những biến đổi thực sự, giúp ngành công nghiệp phát huy mức độ thông minh cao nhất trong điều kiện sức mạnh tính toán nhất định.

5、罗福莉:接下来一年 AGI 历程中最重要的事情是“自进化”。自进化让大模型像顶尖科学家一样去探索,是唯一能“创造新东西”的地方。小米已经借助 Claude Code+顶尖模型,将研究效率提升 10 倍。

  1. Luo Fuli: Điều quan trọng nhất trong hành trình AGI năm tới là “tự tiến hóa”. Tự tiến hóa giúp mô hình lớn khám phá như các nhà khoa học hàng đầu, là nơi duy nhất có thể “tạo ra điều mới”. Xiaomi đã tăng hiệu suất nghiên cứu gấp 10 lần nhờ vào Claude Code + mô hình hàng đầu.

6、夏立雪:当 AGI 时代到来时,基础设施本身都应该是智能体,自主管理整个基础设施,根据 AI 客户的需求去迭代基础设施,实现自我进化、自我迭代。

  1. Xia Lixue: Khi thời đại AGI đến, cơ sở hạ tầng bản thân cũng nên là tác nhân, tự quản lý toàn bộ cơ sở hạ tầng, dựa trên nhu cầu của khách hàng AI để lặp lại cơ sở hạ tầng, đạt được tự tiến hóa và tự lặp lại.

7、夏立雪:OpenClaw 引爆了 token 用量。如今的 token 消耗速度,就像当年 3G 时代手机流量刚起步时,每个月只有 100M 额度的那种感觉。

  1. Xia Lixue: OpenClaw đã kích hoạt lượng token. Tốc độ tiêu thụ token hiện nay giống như cảm giác khi lưu lượng điện thoại 3G mới bắt đầu, chỉ có hạn mức 100M mỗi tháng.

8、黄超:未来很多软件都不是面向人类的,软件、数据和技术都会编程 Agent-Native 的形态,人类未来可能只需要使用那些“让自己快乐的 GUI”。

  1. Huang Chao: Nhiều phần mềm trong tương lai sẽ không hướng đến con người, phần mềm, dữ liệu và công nghệ sẽ đều được lập trình theo hình thức bản địa của tác nhân, con người trong tương lai có thể chỉ cần sử dụng những GUI “khiến mình vui vẻ”.

以下是这场圆桌论坛的完整实录:

Dưới đây là bản ghi đầy đủ của diễn đàn bàn tròn này:

01.OpenClaw 就是“脚手架”,大模型 token 消耗仍处于 3G 时代

  1. OpenClaw chính là “giàn giáo”, tiêu thụ token của mô hình lớn vẫn ở thời đại 3G

杨植麟:很荣幸今天能邀请到各位重磅嘉宾,几位嘉宾来自模型层、算力层再到 agent 层。今天最主要的关键词是开源,然后还有 agent。

Yang Zhilin: Tôi rất vinh dự hôm nay được mời đến tất cả các khách mời quan trọng, một số khách mời đến từ lớp mô hình, lớp sức mạnh tính toán cho đến lớp tác nhân. Từ khóa chính hôm nay là mã nguồn mở, và còn có tác nhân.

第一个问题来谈谈现在最流行的 OpenClaw。大家日常使用 OpenClaw 或者类似的产品有什么觉得最有想象力或者印象深刻的点?从技术的角度来看,如何看待今天 OpenClaw 和相关的 Agent 的演进。

Câu hỏi đầu tiên hãy nói về OpenClaw đang phổ biến nhất hiện nay. Mọi người có điểm nào cảm thấy ấn tượng hoặc có trí tưởng tượng nhất khi sử dụng OpenClaw hoặc các sản phẩm tương tự không? Từ góc độ kỹ thuật, bạn nhìn nhận sự tiến hóa của OpenClaw và các tác nhân liên quan như thế nào hôm nay?

张鹏:很早我就开始自己玩 OpenClaw,当时还叫 Clawbot。我自己动手来折腾,毕竟也是程序员出身,玩这些东西还是有一些自己的体验。

Zhang Peng: Tôi đã bắt đầu chơi OpenClaw từ rất sớm, lúc đó còn gọi là Clawbot. Tôi tự tay thử nghiệm, vì tôi cũng xuất thân từ lập trình viên, chơi những thứ này vẫn có một số trải nghiệm riêng của mình.

我觉得 OpenClaw 给大家带来的最大突破点,或者说新鲜感就在于,它不再是程序员或极客们的专利。普通人也可以比较方便地使用顶尖模型的能力,尤其是在编程和智能体方面的能力。

Tôi nghĩ rằng điểm đột phá lớn nhất mà OpenClaw mang lại cho mọi người, hoặc nói cách khác, sự mới mẻ nằm ở chỗ nó không còn là tài sản riêng của các lập trình viên hay những người đam mê công nghệ nữa. Người bình thường cũng có thể dễ dàng sử dụng khả năng của các mô hình hàng đầu, đặc biệt trong lĩnh vực lập trình và các tác nhân thông minh.

所以我到现在为止,跟大家在交流的过程当中,我更愿意把 OpenClaw 称作“脚手架”。它提供的是一种可能性,在模型的基础之上搭起了一个很牢固、很方便,但是又很灵活的脚手架。大家可以按照自己的意愿,去使用很多底层模型提供的新奇功能。

Vì vậy, đến giờ, trong quá trình giao tiếp với mọi người, tôi thích gọi OpenClaw là “giàn giáo”. Nó cung cấp một khả năng, xây dựng một giàn giáo rất vững chắc, tiện lợi nhưng cũng rất linh hoạt trên cơ sở của mô hình. Mọi người có thể theo ý muốn của mình, sử dụng nhiều chức năng mới mà các mô hình cơ sở cung cấp.

原来自己的想法可能会受限于不会写代码,或者没有掌握其他的相关技能,今天有了 OpenClaw,终于可以通过很简单的交流就把它完成。

Trước đây, ý tưởng của bản thân có thể bị hạn chế bởi việc không biết viết mã, hoặc không nắm vững các kỹ năng liên quan khác, hôm nay có OpenClaw, cuối cùng có thể hoàn thành điều đó thông qua giao tiếp rất đơn giản.

OpenClaw 给我带来非常大的冲击,或者说让我重新认识了这件事。

OpenClaw đã mang đến cho tôi một cú sốc rất lớn, hoặc nói cách khác, giúp tôi nhận thức lại điều này.

夏立雪:其实我最开始用 OpenClaw 的时候是不太适应的,因为我习惯于跟大模型聊天的交流方式,使用后我感觉 OpenClaw 反应好慢。

Xia Lixue: Thực ra lúc đầu tôi không quen khi sử dụng OpenClaw, vì tôi đã quen với cách giao tiếp với các mô hình lớn, khi sử dụng tôi cảm thấy phản ứng của OpenClaw chậm chạp.

但后来我意识到一个问题,就是它和之前的聊天机器人有一个很大的不同,本质是一个能帮我完成大型任务的“人”。我开始给它提交更复杂的任务,就发现其实它能够做得很好。

Nhưng sau đó tôi nhận ra một vấn đề, đó là nó khác rất nhiều so với các chatbot trước đây, bản chất là một “con người” có thể giúp tôi hoàn thành các nhiệm vụ lớn. Tôi bắt đầu giao cho nó các nhiệm vụ phức tạp hơn, và thấy rằng nó thực sự có thể làm rất tốt.

这件事情给我带来很大的感触。模型一开始按照 token 去聊天,到现在能够变成一个 agent,变成一个龙虾,能够帮你去完成任务。这件事对 AI 的整体想象力空间带来很大的提升。

Điều này đã gây cho tôi nhiều cảm xúc. Mô hình ban đầu giao tiếp theo token, đến bây giờ có thể trở thành một tác nhân, trở thành một con tôm, có thể giúp bạn hoàn thành nhiệm vụ. Điều này đã nâng cao không gian tưởng tượng tổng thể về AI rất nhiều.

同时,它对于整个系统的能力的要求也变得很高。这也是为什么我一开始用 OpenClaw,会觉得它有点卡。作为基础设施层的厂商,我看到的是 OpenClaw 对于 AI 背后的大型系统和生态都带来了更多的机遇和挑战。

Đồng thời, yêu cầu về khả năng của toàn bộ hệ thống cũng trở nên cao hơn. Đó cũng là lý do tại sao tôi lúc đầu thấy OpenClaw có chút chậm chạp. Là một nhà cung cấp ở cấp cơ sở hạ tầng, tôi thấy rằng OpenClaw đã mang đến nhiều cơ hội và thách thức hơn cho các hệ thống lớn và hệ sinh thái phía sau AI.

我们现在所有能够用到的资源,想要支撑起这样一个快速增长的时代是不够的。比如说就拿我们公司来说,我们公司从一月底开始,基本上每两周 token 用量就翻一番,到现在基本上涨了 10 倍。

Tất cả các nguồn lực mà chúng ta hiện có không đủ để hỗ trợ một kỷ nguyên phát triển nhanh như vậy. Ví dụ, công ty của chúng tôi từ cuối tháng 1 đến nay, gần như mỗi hai tuần lượng token đã gấp đôi, và giờ đã tăng khoảng 10 lần.

上次见到这个速度,还是当年用 3G 手机消耗流量的时候。我有种感觉,现在的 token 用量,就像当年每个月只有 100M 手机流量的那个时代。

Lần cuối tôi thấy tốc độ này là khi sử dụng lưu lượng điện thoại 3G. Tôi có cảm giác rằng lượng token hiện tại giống như thời đại mà lưu lượng điện thoại chỉ có 100M mỗi tháng.

这种情况下,我们所有的资源都需要进行更好的优化,进行更好的整合。让每一个人,不仅仅在 AI 领域,而是在整个社会中的每一个人都能够去把 OpenClaw的 AI 能力用起来。

Trong tình huống này, tất cả các tài nguyên của chúng ta cần được tối ưu hóa tốt hơn và được tích hợp tốt hơn. Để mỗi người, không chỉ trong lĩnh vực AI, mà còn trong toàn xã hội, có thể sử dụng khả năng AI của OpenClaw.

作为基础设施的玩家,我对这个时代是非常激动、深有感触的。我也认为这里边有很多的优化空间是我们仍然应该去探索,应该去尝试的。

Là một người chơi trong lĩnh vực cơ sở hạ tầng, tôi rất phấn khởi và cảm thấy sâu sắc về thời đại này. Tôi cũng tin rằng trong lĩnh vực này còn rất nhiều không gian tối ưu mà chúng ta vẫn nên khám phá và thử nghiệm.

02.OpenClaw 拉高国产模型上限,交互模式突破意义重大

  1. OpenClaw nâng cao giới hạn trên của mô hình nội địa, đột phá trong kiểu tương tác có ý nghĩa to lớn

罗福莉:我自己是把 OpenClaw 当做 agent 框架演进过程中,一个极具革命性和颠覆性的事件来看待的。

Luo Fuli: Tôi coi OpenClaw là một sự kiện cách mạng và mang tính đột phá trong quá trình tiến hóa của khung tác nhân.

其实我身边所有在进行非常深度 coding 的人,他们的第一选择还是 Claude Code。但是,我相信用 OpenClaw 的人会感受到,它在 Agent 框架上的很多设计是领先于 Claude Code 的。最近 Claude Code 有很多更新其实都是在向 OpenClaw 去靠近。

Thực tế, tất cả những người xung quanh tôi đang thực hiện lập trình sâu sắc, lựa chọn đầu tiên của họ vẫn là Claude Code. Tuy nhiên, tôi tin rằng những người sử dụng OpenClaw sẽ cảm nhận được rằng nhiều thiết kế của nó trong khung tác nhân đang dẫn đầu so với Claude Code. Gần đây, Claude Code đã có nhiều bản cập nhật thực sự đang tiến gần đến OpenClaw.

我自己使用 OpenClaw 时的感受是,这个框架给我自己带来更多是想象力的随时随地的扩展。Claude Code 最开始只能在我的桌面上去延展我的创意,但是 OpenClaw 可以随时随地去延展我的创意。

Cảm nhận của tôi khi sử dụng OpenClaw là khung này đã mang lại cho tôi khả năng mở rộng trí tưởng tượng ở bất cứ đâu. Claude Code trước đây chỉ có thể mở rộng ý tưởng của tôi trên máy tính để bàn, nhưng OpenClaw có thể mở rộng ý tưởng của tôi ở bất cứ đâu.

OpenClaw 带来的核心价值主要有两点。第一点是它开源。开源这件事,非常有利于整个社区深度参与进来,重视并推动这个框架的演进,这是一个很重要的前置条件。

Giá trị cốt lõi mà OpenClaw mang lại chủ yếu có hai điểm. Điểm đầu tiên là nó mã nguồn mở. Mã nguồn mở rất có lợi cho toàn bộ cộng đồng tham gia sâu sắc, coi trọng và thúc đẩy sự tiến hóa của khung này, đây là một điều kiện tiên quyết rất quan trọng.

像 OpenClaw 这样的 AI 框架,我觉得一个很大的价值在于,它把国内那些水平虽然接近闭源模型、但还没完全追上的模型的上限拉到了很高。

Tôi nghĩ rằng một giá trị lớn của các khung AI như OpenClaw là nó nâng cao giới hạn của các mô hình nội địa mặc dù trình độ chưa hoàn toàn đạt đến mô hình đóng nhưng lại gần gũi với nó.

在绝大多数场景下,你会发现它(国产开源模型+OpenClaw)的任务完成度已经非常接近 Claude 的最新模型。同时,它又很好地把下限保证了——通过一套 Harness 系统,或者说借助它的 Skills 体系等多方面的设计,保障了任务的完整度和准确率。

Trong hầu hết các tình huống, bạn sẽ thấy rằng độ hoàn thành nhiệm vụ của nó (mô hình mã nguồn mở nội địa + OpenClaw) đã rất gần với mô hình mới nhất của Claude. Đồng thời, nó cũng đảm bảo tốt giới hạn dưới - thông qua một hệ thống Harness, hoặc nói cách khác, nhờ vào thiết kế đa phương diện của hệ thống Skills, đảm bảo độ hoàn chỉnh và chính xác của nhiệm vụ.

总结一下,从基座大模型厂商的开发者角度来看,OpenClaw 保证了基础大模型的下限,拉高了上限。

Tóm lại, từ góc nhìn của nhà phát triển mô hình lớn cơ sở, OpenClaw đảm bảo giới hạn dưới của mô hình lớn cơ sở, nâng cao giới hạn trên.

此外,我认为它给整个社区带来的另一个价值是,它点燃了大家的认知,让大家发现在大模型之外,Agent 这一层其实蕴藏着非常大的想象空间。

Ngoài ra, tôi nghĩ rằng nó đã mang lại giá trị khác cho toàn bộ cộng đồng, đó là nó đã thắp sáng nhận thức của mọi người, giúp mọi người nhận ra rằng bên ngoài mô hình lớn, tầng tác nhân thực sự chứa đựng một không gian tưởng tượng rất lớn.

我最近也观察到,社区里除了研究员之外,越来越多的人开始参与到 AGI 的变革中来,更多人开始接触像 Harness、Scaffold 这样更强大的 Agent 框架。这些人某种程度上是在用这些工具替代自己的一部分工作,同时也是在释放自己的时间,去投入到更有想象力的事情上。

Gần đây, tôi cũng đã quan sát thấy, ngoài các nhà nghiên cứu, ngày càng nhiều người tham gia vào cuộc cách mạng AGI, ngày càng nhiều người bắt đầu tiếp cận những khung tác nhân mạnh mẽ như Harness, Scaffold. Những người này ở một mức độ nào đó đang sử dụng những công cụ này để thay thế một phần công việc của mình, đồng thời cũng giải phóng thời gian của họ để đầu tư vào những điều có trí tưởng tượng hơn.

黄超:我觉得首先从交互模式来讲,OpenClaw 这次之所以能火,第一个原因可能是它给了一种更有“活人感”的体验。其实我们做 Agent 也有一两年了,但之前像 Cursor、Claude Code 这些 Agent,给人的感觉更多是一种“工具感”。而 OpenClaw 第一次以“即时通讯软件嵌入”的方式,让人更有一种接近心目中“个人贾维斯”的感觉。我觉得这可能是交互模式上的一个突破。

Huang Chao: Tôi nghĩ rằng trước tiên từ góc độ tương tác, lý do OpenClaw có thể nổi bật lần này có thể là vì nó mang lại trải nghiệm “có cảm giác sống” hơn. Thực tế, chúng tôi đã làm tác nhân được một hoặc hai năm, nhưng trước đây như Cursor, Claude Code, những tác nhân này, cảm giác của mọi người nhiều hơn là “cảm giác công cụ”. Còn OpenClaw lần đầu tiên được nhúng theo cách “phần mềm nhắn tin tức thời”, khiến người ta cảm thấy gần gũi hơn với hình ảnh “JARVIS cá nhân” trong tâm trí. Tôi nghĩ rằng đây có thể là một bước đột phá trong kiểu tương tác.

另外一点,它给整个社区带来的启发是:像 Agent Loop 这种简单但高效的框架,再次被证明是可行的。同时,它也让我们重新思考一个问题:我们到底是需要一个全能型的、能做所有事情的超级智能体,还是需要一个更好的“小管家”,像一个轻量级的操作系统或脚手架?

Một điểm nữa, nó đã mang đến cho toàn bộ cộng đồng một sự khơi dậy: khung đơn giản nhưng hiệu quả như Agent Loop lại một lần nữa được chứng minh là khả thi. Đồng thời, nó cũng khiến chúng ta suy nghĩ lại một vấn đề: liệu chúng ta có cần một tác nhân siêu thông minh toàn năng, có thể làm tất cả mọi thứ, hay cần một “người quản gia” tốt hơn, giống như một hệ điều hành hoặc giàn giáo nhẹ nhàng hơn?

OpenClaw 带来的思路是,通过这样一个“小系统”或者说“龙虾操作系统”和它的生态,让大家真正有“玩起来”的心态,进而撬动整个生态里的所有工具。

Ý tưởng mà OpenClaw mang lại là thông qua một “hệ thống nhỏ” hoặc nói cách khác là “hệ điều hành tôm” và sinh thái của nó, giúp mọi người thực sự có tâm lý “chơi đùa”, từ đó kích hoạt tất cả các công cụ trong hệ sinh thái.

随着 Skills、Harness 这类能力的出现,越来越多的人可以去设计面向 OpenClaw 这类系统的应用,去赋能各行各业。我觉得这一点天然就跟整个开源生态结合得非常紧密。在我看来,这两点是我们获得的最大启发。

Với sự xuất hiện của các khả năng như Skills, Harness, ngày càng nhiều người có thể thiết kế ứng dụng dành cho các hệ thống như OpenClaw, để mang lại sức mạnh cho các ngành nghề khác nhau. Tôi nghĩ rằng điều này một cách tự nhiên kết hợp rất chặt chẽ với toàn bộ hệ sinh thái mã nguồn mở. Trong quan điểm của tôi, đây là hai điểm lớn nhất mà chúng tôi đã nhận được.

03.GLM 新模型专为“干活”打造,涨价是对正常商业价值的回归

  1. Mô hình mới GLM được thiết kế đặc biệt để “làm việc”, việc tăng giá là trở về giá trị thương mại bình thường

杨植麟:想问一下张鹏。最近看到智谱发布了新的 GLM-5 Turbo 模型,我理解在 Agent 能力上做了很大的增强。能不能给大家介绍一下这个新模型和其他模型的不同之处?另外我们也观察到有提价的策略,这反映了什么样的市场信号?

Yang Zhilin: Tôi muốn hỏi Zhang Peng. Gần đây tôi thấy Zhizhu đã phát hành mô hình GLM-5 Turbo mới, tôi hiểu rằng nó đã tăng cường rất nhiều về khả năng tác nhân. Bạn có thể giới thiệu cho mọi người về mô hình mới này và sự khác biệt của nó với các mô hình khác không? Ngoài ra, chúng tôi cũng quan sát thấy có chiến lược tăng giá, điều này phản ánh tín hiệu gì của thị trường?

张鹏:这是个很好的问题。前两天我们确实紧急更新了一波,这其实是我们整个发展路标中的一个阶段,只是提前把它放了出来。

Zhang Peng: Đây là một câu hỏi rất hay. Hai ngày trước, chúng tôi thực sự đã cập nhật một đợt khẩn cấp, thực tế đây chỉ là một giai đoạn trong lộ trình phát triển của chúng tôi, chỉ là chúng tôi đã đưa ra sớm hơn.

最主要的目的,是从原来的“简单对话”转向“真正干活”——这也是大家最近普遍感受到的:大模型不再只是能聊天,而是真的能帮人干活了。

Mục tiêu chính là chuyển từ “đối thoại đơn giản” sang “làm việc thật sự” - đây cũng là điều mà gần đây mọi người đều cảm nhận được: mô hình lớn không còn chỉ có thể trò chuyện, mà thực sự có thể giúp con người làm việc.

但“干活”背后隐含的能力要求非常高。模型需要自己去做长程的任务规划、不断试错、压缩上下文、调试,还可能要处理多模态信息。所以它对模型能力的要求,和传统面向对话的通用模型其实不太一样。GLM-5 Turbo 就是在这些方面做了专门加强,尤其是你提到的——让它干活、跑上七十二小时,怎么能够不停地 loop,这里边我们做了很多工作。

Nhưng việc “làm việc” ẩn chứa yêu cầu khả năng rất cao. Mô hình cần tự lập kế hoạch nhiệm vụ dài hạn, liên tục thử nghiệm, nén ngữ cảnh, gỡ lỗi, và có thể xử lý thông tin đa phương thức. Vì vậy, yêu cầu về khả năng của nó so với các mô hình tổng quát truyền thống hướng đến đối thoại thực tế là khác nhau. GLM-5 Turbo đã được tăng cường đặc biệt ở những khía cạnh này, đặc biệt là như bạn đã đề cập - làm cho nó có khả năng làm việc, chạy liên tục trong bảy mươi hai giờ, làm thế nào để nó có thể lặp đi lặp lại, ở đây chúng tôi đã thực hiện rất nhiều công việc.

另外大家也很关注 token 消耗的问题。让一个聪明的模型去干复杂任务,token 的消耗量是巨大的。普通人可能感知不深,但看账单的时候会发现钱掉得特别快。所以我们在这方面也做了优化,在面临复杂任务时,模型能用更高效的 token 效率去完成。总体上,模型的架构还是多任务协同的通用架构,只是在能力上做了偏向性的加强。

Ngoài ra, mọi người cũng rất quan tâm đến vấn đề tiêu thụ token. Để một mô hình thông minh thực hiện các nhiệm vụ phức tạp, lượng token tiêu thụ là rất lớn. Người bình thường có thể không cảm nhận rõ, nhưng khi nhìn vào hóa đơn sẽ thấy tiền tiêu rất nhanh. Vì vậy, chúng tôi cũng đã tối ưu hóa trong lĩnh vực này, khi đối mặt với các nhiệm vụ phức tạp, mô hình có thể hoàn thành với hiệu suất token hiệu quả hơn. Tổng thể, kiến trúc của mô hình vẫn là kiến trúc tổng quát hợp tác đa nhiệm, chỉ là có sự tăng cường về khả năng.

提价这件事其实也很好解释。刚才说了,现在不再是简单地问一个问题就得到一个回答,背后的推理链路非常长。很多任务要通过写代码和底层基础设施打交道,还要不断 debug、修正错误,消耗量非常大。完成一个复杂任务需要的 token 量,可能是原来回答一个简单问题的十倍甚至百倍。

Việc tăng giá thực ra cũng dễ lý giải. Như đã nói, giờ không còn đơn giản chỉ là hỏi một câu để nhận được câu trả lời, mà chuỗi suy luận phía sau rất dài. Nhiều nhiệm vụ phải thông qua việc viết mã và giao tiếp với cơ sở hạ tầng bên dưới, đồng thời cũng phải liên tục gỡ lỗi, sửa lỗi, mức tiêu thụ rất lớn. Lượng token cần thiết để hoàn thành một nhiệm vụ phức tạp có thể gấp mười hoặc thậm chí một trăm lần so với việc trả lời một câu hỏi đơn giản.

所以价格上需要有一定的提升,模型也变大了,推理成本相应提高了。我们把它回归到正常的商业价值上,因为长期靠低价竞争也不利于整个行业的发展。这也是我们让商业化能形成一个良性闭环,持续优化模型能力,给大家提供更好服务的。

Vì vậy, giá cả cần phải có sự tăng lên nhất định, mô hình cũng trở nên lớn hơn, chi phí suy luận tăng tương ứng. Chúng tôi đã đưa nó trở lại giá trị thương mại bình thường, vì cạnh tranh giá thấp lâu dài cũng không có lợi cho sự phát triển của toàn ngành. Đây cũng là cách mà chúng tôi tạo ra một vòng lặp tốt cho thương mại, tối ưu hóa liên tục khả năng của mô hình, cung cấp dịch vụ tốt hơn cho mọi người.

04.打造更高效 token 工厂,基础设施本身也应该是 Agent

  1. Xây dựng nhà máy token hiệu quả hơn, cơ sở hạ tầng bản thân cũng nên là tác nhân

杨植麟:现在开源模型越来越多,也开始形成生态,各种模型可以在不同的算力平台上给用户提供更多价值。随着 token 用量的爆发,大模型也正在从训练时代走向推理时代。想请教一下立雪,从基础设施的层面来看,推理时代对于无问来说意味着什么?

Yang Zhilin: Hiện nay có ngày càng nhiều mô hình mã nguồn mở và bắt đầu hình thành hệ sinh thái, nhiều mô hình có thể cung cấp giá trị hơn cho người dùng trên các nền tảng tính toán khác nhau. Với sự bùng nổ lượng token, mô hình lớn cũng đang chuyển từ kỷ nguyên đào tạo sang kỷ nguyên suy luận. Tôi muốn hỏi Lixue, từ góc độ cơ sở hạ tầng, kỷ nguyên suy luận có ý nghĩa gì đối với Wu Wen?

夏立雪:我们是一家诞生在 AI 时代的基础设施厂商,现在也在为智谱、Kimi、Mimo 等提供支持,让大家能把 token 工厂更高效地用起来。同时我们也在跟很多高校、科研院所合作。

Xia Lixue: Chúng tôi là một nhà cung cấp cơ sở hạ tầng ra đời trong kỷ nguyên AI, hiện đang hỗ trợ Zhizhu, Kimi, Mimo và nhiều tổ chức khác, giúp mọi người có thể sử dụng nhà máy token hiệu quả hơn. Đồng thời, chúng tôi cũng đang hợp tác với nhiều trường đại học và viện nghiên cứu.

所以我们一直在思考一件事:AGI 时代需要什么样的基础设施?以及我们怎么一步步去实现和推演它。我们现在对短期、中期、长期不同阶段需要解决的问题,已经做好了充分准备。

Vì vậy, chúng tôi luôn suy nghĩ về một điều: Cơ sở hạ tầng nào là cần thiết trong kỷ nguyên AGI? Và chúng tôi sẽ từng bước hiện thực hóa và diễn giải điều đó như thế nào. Chúng tôi đã chuẩn bị đầy đủ để giải quyết các vấn đề cần thiết trong các giai đoạn ngắn hạn, trung hạn và dài hạn.

当前最直接的问题,就是大家刚才聊到的——整个 Open 带起来的 token 量暴增,对系统效率提出了更高的优化需求。包括价格的调整,其实也是在这个需求下的一种应对方式。

Vấn đề trực tiếp nhất hiện tại là điều mọi người vừa đề cập - lượng token tăng vọt do Open mang lại đã đặt ra yêu cầu tối ưu hóa cao hơn cho hiệu suất hệ thống. Bao gồm việc điều chỉnh giá cả, thực tế cũng là một cách ứng phó với nhu cầu này.

我们一直是通过软硬件打通的方式来布局和解决的。比如我们接入了几乎所有种类的计算芯片,把国内十几种不同的芯片和几十个不同的算力集群统一连接起来。这样能解决 AI 系统里算力资源紧缺的问题,资源不足时,最好的办法就是先把能用上的资源都用起来,然后让每一个算力都用在刀刃上,发挥出最大的转化效率。

Chúng tôi luôn bố trí và giải quyết thông qua việc kết nối phần mềm và phần cứng. Ví dụ, chúng tôi đã kết nối hầu hết các loại chip tính toán, kết nối hơn mười loại chip khác nhau trong nước và hàng chục cụm sức mạnh tính toán khác nhau. Điều này có thể giải quyết vấn đề thiếu hụt tài nguyên tính toán trong hệ thống AI, khi tài nguyên không đủ, cách tốt nhất là sử dụng tất cả các tài nguyên có thể, sau đó để mỗi sức mạnh tính toán phát huy hiệu quả chuyển đổi tối đa.

所以在这个阶段,我们要解决的就是怎么打造一个更高效的 token 工厂。这里边我们做了很多优化,包括让模型和硬件上的显存等各种资源做最优适配,也在看最新的模型结构和硬件结构之间能不能产生更深的化学反应。但解决当前的效率问题,其实只是打造了一个标准化的 token 工厂。

Vì vậy, trong giai đoạn này, điều chúng tôi cần giải quyết là làm thế nào để xây dựng một nhà máy token hiệu quả hơn. Chúng tôi đã thực hiện rất nhiều tối ưu hóa trong việc điều chỉnh các mô hình và tài nguyên như bộ nhớ trên phần cứng, cũng như xem liệu có thể tạo ra phản ứng hóa học sâu hơn giữa các cấu trúc mô hình và cấu trúc phần cứng mới nhất. Nhưng việc giải quyết vấn đề hiệu suất hiện tại thực sự chỉ là xây dựng một nhà máy token tiêu chuẩn hóa.

面向 Agent 时代,我们认为这还不够。因为 Agent 更像一个人,可以交给它一个任务。我坚定地认为,当前很多云计算时代的基础设施,是为服务一个程序、服务人类工程师设计的,而不是为 AI 设计的。这相当于我们做了一个基础设施,上面是给人用的接口,再在上面包一层去接入 Agent,这种方式其实是用人的操作能力限制了 Agent 的发挥空间。

Hướng tới kỷ nguyên tác nhân, chúng tôi cho rằng điều này vẫn chưa đủ. Bởi vì tác nhân giống như một con người, có thể giao cho nó một nhiệm vụ. Tôi tin chắc rằng cơ sở hạ tầng hiện tại

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim