🔥 WCTC S8 全球交易赛正式开赛!
8,000,000 USDT 超级奖池解锁开启
🏆 团队赛:上半场正式开启,预报名阶段 5,500+ 战队现已集结
交易量收益额双重比拼,解锁上半场 1,800,000 USDT 奖池
🏆 个人赛:现货、合约、TradFi、ETF、闪兑、跟单齐上阵
全场交易量比拼,瓜分 2,000,000 USDT 奖池
🏆 王者 PK 赛:零门槛参与,实时匹配享受战斗快感
收益率即时 PK,瓜分 1,600,000 USDT 奖池
活动时间:2026 年 4月 23 日 16:00:00 -2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即参与:https://www.gate.com/competition/wctc-s8
#WCTCS8
我最近看到了一则有趣的对比,内容涉及不同 AI 模型的能力。在 PinchBench 基准测试中,OpenClaw 代理在任务中由 Gemini 3 Flash 以 95.1% 的成功率位居首位,这相当令人印象深刻。
有意思的是,其他一些强大的模型也非常接近。minimax-m2.1 达到了 93.6%,kimi-k2.5 达到了 93.4%。此外,Claude Sonnet 4.5 为 92.7%,而 GPT-4o 为 85.2%。这些数字表明,不同模型在不同任务中的表现存在差异。
这些数据对那些希望选择合适 AI 模型的人来说非常重要。Magma 的 CISO 23pads 曾分享过这份信息,这也显示出 AI 发展的速度有多快。如果你正在为基于代理的任务寻找某些模型,那么这些结果可能会非常有帮助。