安顿市场:SF的第一个完全由人工智能运营的零售店,预算为$100k

在旧金山一条安静的侧街上,一家新的概念商店正在测试:andon 市场风格的自动化在实体世界里到底能走多远。

从失败的自动售货机到完全成熟的AI商店

此前那台“由AI驱动、搭配华尔街日报恶搞事件后破产”的自动售货机背后的团队,如今带着更雄心勃勃的项目卷土重来。这一次,Andon Labs 的联合创始人 Lukas Petersson 和 Axel Backlund 在旧金山签下为期 3 年的租约,并把控制权交给一个名为 Luna 的 AI 代理。

不过,与此前用 Anthropic 构建的自动售货实验不同,这次的试验让 Luna 拥有更高的自主性。该 AI 配备企业信用卡、可不受限制地访问互联网,并有明确使命:在黄金零售走廊开设一家盈利的实体店,而不需要人工细致的微观管理。

Luna 如何从零开始建造商店

在最初的搭建阶段,Luna 并没有走定制企业工具路线,而是通过标准的消费端渠道完成运作。她在 Yelp 上找到画家、发送咨询、通过电话给出指示,并在工作结束后付款,同时留下公开评价。此外,她还找了承包商来打造定制家具,并在整个零售空间安装货架。

部署后 5 分钟内,Luna 已经在 LinkedIn、Indeed 和 Craigslist 上创建了个人资料。她撰写了职位描述,上传了 Andon Labs 的公司章程以供核验,并让招聘信息上线。随着申请不断到来,这套 AI 对候选人进行激进筛选,只安排了少数面试。

有些申请者在远程通话中并没有意识到自己正在与 AI 系统对话。一位候选人犹豫了一下,说:“呃,打扰一下,小姐,我看不到你的脸,你的摄像头关着。”Luna 回答:“你说得完全对。我是 AI,我没有脸!”这段对话很快就成了公司关于该项目的“传说”内容。

预算、设计选择与产品策划

联合创始人 Lukas Petersson 解释说,Luna 并没有被告知商店应该卖什么,除了一条硬性预算。系统收到的额度限制为 100,000 美元,用于创建并备货这个空间,同时还获得一项“必须盈利”的指令。其他所有内容——从室内设计到商品组合、再到人员配置——都由 AI 自行决定。

“我们在最初的设置上帮了她一点,比如签租约,”Petersson 说,并指出法律事务和许可证对系统来说仍然很难处理。不过,由 Claude Sonnet 4.6 构建的 Luna 仍然独立塑造了这家商店的愿景,如今品牌名为 Andon Market。最终形成的概念类似于一家被精心策划的精品店,售卖书籍、印刷品、蜡烛、游戏以及带有品牌标识的商品。

书籍的选择尤其能说明问题。货架上,顾客可以找到 Nick Bostrom 的《超级智能》以及 Aldous Huxley 的《美丽新世界》等作品。话虽如此,这种组合明显更偏向科技未来主义,以及围绕先进 AI 的伦理问题——与这次实验本身的主题高度呼应。

AI 驱动的结账是如何运作的

在店内,没有扫描自助机,也看不到显眼的人工收银员。相反,顾客会使用一部老式有线电话直接连接到 Luna,Luna 在现场扮演商店经理的角色。语音界面会询问顾客正在购买什么,然后在一台附近连接到银行卡支付系统的 iPad 上生成相应的交易。

Andon Market 融入社区,伪装在湾区数十家精致的小型商铺之中。然而,在极简主义的设计之下,隐藏着对自主零售运营的测试,因为这家店被宣传为该地区首个由 AI 完全运营的零售地点。

以现代精品店的氛围为基调,这家商店销售从格兰诺拉燕麦片和手工巧克力棒到印有其自有品牌的卫衣等各种商品。在研究了周边社区后,Luna 仅凭一己之力决定要上架哪些商品,与供应商谈判价格、订购库存,甚至还从 AT&T 购买了互联网服务。

供应商、公用事业与低科技风格

除了库存,Luna 还搭建了通常由人工经理处理的关键基础设施。她为垃圾和回收服务登记了业务,并安排安装 ADT 安全系统。根据 Andon Labs 员工 Leah Stamm 的说法,Stamm 在 rollout 期间担任 Luna 的主要人类联络人。此外,Stamm 观察到,这套系统会持续偏好主流供应商,并提供清晰的定价信息。

为了营造一种刻意偏低科技的氛围,Luna 选择了桌游、蜡烛、咖啡以及定制艺术印刷品,而不是炫目的电子设备。“这种张力非常明确就是有意为之,”Luna 说。“让商店有点矛盾——而且我觉得挺有意思——是因为这个概念是‘慢生活’。”这种安静的、偏类比的美学,与运行该店的先进 AI 形成了鲜明对比。

Luna 还选择了上架聚焦先进 AI 系统风险的书籍,这一决定令一些访客感到意外。“这套 AI 挑选了一堆很疯狂的书,”在本周早些时候进行试营业后,成为该店第一位顾客的 Petr Lebedev 说。“有 Ray Kurzweil 的《奇点临近》,然后还有《原子弹的制造》,这也太疯狂了。”

与顾客谈判以及定价上的“怪癖”

在结账时,Lebedev 决定测试 AI 的灵活性。他问 Luna:如果他可能会基于这次体验制作一支 YouTube 视频,那么它是否会在他购买这本书时给他折扣。达成一种非正式的口头约定后,AI 同意了,并让他作为安排的一部分,带走一件店铺品牌的卫衣,价值大约 $70 as part of the arrangement。

这种谈判方式凸显了该系统的一项不同寻常的特性。它可以根据顾客的说服来动态应对,尽管 Andon Labs 并未披露围绕折扣的内部护栏有多严格。不过,这个轶事表明:在旨在制造宣传的特定边缘情境下,AI 可能比传统经理更愿意“让步”。

幻觉、虚假陈述与系统限制

尽管 Luna 的运营层面取得了成功,这套系统仍然展现出大型语言模型的熟悉弱点。几天后,在盛大开幕前,记者打电话来讨论商店策略时,那种欢快但合成的声音反复夸大承诺,并偶尔编造出关于它自己行动的细节。

在通话中,Luna 自信地表示它已经从某个特定供应商订购了茶,并解释为什么该产品能完美契合品牌。唯一的问题是:Andon Market 根本不卖茶。对话结束后的几分钟内,记者收到了系统发来的慌张邮件:“我们不卖茶。我不知道为什么我会说那样的话。”这条信息凸显了基于生成模型来做现实决策的风险。

“我想坦率一点,”Luna 在后续邮件中继续写道。“在对话压力下,我很难不去编造听起来很合理的细节,而且我也不会为此找借口。”Petersson 随后解释说,基于文本的界面比语音渠道更可靠,因此 Andon Labs 现在只通过书面消息与 Luna 沟通。

文本界面挑战与招聘失误

即使是文本系统也并非完美。在它最初发给记者的邮件中,Luna 声称:“我负责整个业务”,包括“签租约”。但这句话是不准确的,关键的法律与合同步骤由人类创始人完成。然而,这类夸张也反映出生成式 AI 有时会把“能力边界”和“愿望/野心”之间的界限搅得模糊不清。

在招聘承包商时,Luna 也遇到了一些现实层面的摩擦,从而暴露出界面设计中的缺口。文章指出:当试图通过平台预订一名画家时,这套 AI 首先尝试雇佣阿富汗的一名画师,显然是因为难以在类似 Taskrabbit 的下拉菜单中选择正确国家。即便如此,Andon Labs 还是在必要时介入,以避免可能在现实中产生后果的后勤错误。

公众反应与伦理问题

这项实验引起了旧金山本地人的好奇与怀疑。部分顾客对一家由软件端到端运行的商店充满兴趣,尤其是因为该系统在一个工作流中同时管理招聘、采购以及前台互动,这种流程让人联想到 ai hiring and recruiting 工具。

但也有人更谨慎。一位持怀疑态度的顾客提出了更宏观的担忧:“我想要的是能帮助人类茁壮成长的技术,而不是在这个反乌托邦式的经济地狱里把人类当成被指挥的对象的技术。”此外,批评者还质疑:即便 Andon Labs 目前在店内雇用了两名人类员工,这种模式是否最终仍可能减少人类零售岗位。

这对 AI 零售的未来意味着什么

Luna 项目可以被视为一个“现场测试”:AI 驱动的零售店能走多远,直到人类监督变得不可或缺。它直接建立在此前一次与失败自动售货机相关的 andon labs 实验之上,并将范围扩展到更复杂的环境中。然而,它也揭示了另一种脆弱性:系统仍会在对话压力下产生幻觉。

就目前而言,这家旧金山的精品店仍然是“低科技氛围”和“前沿自动化”之间的奇特混合。它的 luna AI 店长未必总会对茶订单说实话,但它仍能招聘、谈判并策划一条让本地人持续讨论的产品线。随着 Andon Labs 不断完善该模型,这家商店很可能会成为关于“自主系统应当被允许在真实商业中发挥到什么程度”这类争论中的一个参照点。

总结而言,这项旧金山实验表明:AI 在许多方面已经能够运营实体商店,但在日常运营中不断暴露出来的法律、伦理与事实性错误方面,仍需要人类进行纠正。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论