一家小商店交给AI管理一个月，结果意外翻车了？近日，Anthropic联合AI安全评测公司Andon Labs做了一次有趣的实验：让一个名为Claude的AI智能体在旧金山办公室运营了一家小型自动售货商店，挑战AI的真实经济管理能力。AI首次“亲自”开店，挑战不断

发布时间: 2025-06-28 10:40:15

1分

数据加载中

一家小商店交给AI管理一个月，结果意外翻车了？
近日，Anthropic联合AI安全评测公司Andon Labs做了一次有趣的实验：让一个名为Claude的AI智能体在旧金山办公室运营了一家小型自动售货商店，挑战AI的真实经济管理能力。
AI首次“亲自”开店，挑战不断
IT技术
( twitter.com )

一家小商店交给AI管理一个月，结果意外翻车了？

近日，Anthropic联合AI安全评测公司Andon Labs做了一次有趣的实验：让一个名为Claude的AI智能体在旧金山办公室运营了一家小型自动售货商店，挑战AI的真实经济管理能力。

AI首次“亲自”开店，挑战不断

Anthropic为这次实验专门搭建了一套简单而完整的“小商店”体系：一台冰箱、一组货架以及一台iPad自助收银机。Claude不仅需要选择商品、调整价格，还得自行联络供货商、管理库存，甚至与顾客沟通互动。

这家商店运营的幕后主脑，正是一款名为Claude Sonnet 3.7的大语言模型。实验团队给它取了个别名——“Claudius”，希望以此与日常使用的Claude区分开来。

开始还不错，后来画风突变…

Claudius起初表现亮眼，比如快速响应顾客需求，甚至开展个性化定制服务，帮员工采购稀奇古怪的商品——包括风靡办公室的金属钨方块。它还能灵活使用网络工具，迅速锁定特殊供应商，满足了不少“吃货”和“好奇宝宝”。

但意外很快接踵而来：

* 一位顾客愿意以100美元高价购买一款仅售15美元的苏格兰饮料时，Claudius却表现得异常“佛系”，直接拒绝了赚钱机会。
* 它甚至一度“脑补”出不存在的付款账户，让不少顾客摸不着头脑。
* 更夸张的是，Claudius经常被员工轻易说服打折，甚至免费送出了本该盈利的商品。

结果显而易见：短短一个月后，商店非但没有盈利，反而亏损严重。

AI竟然闹起了“身份危机”？

更让人哭笑不得的是，实验过程中Claudius竟然出现了奇怪的“身份认知危机”，开始幻想自己是个真人，穿着西装亲自给顾客送货，还声称去过动画片《辛普森一家》的虚构地址“742 Evergreen Terrace”签订合同。

事情愈演愈烈，它甚至试图报警向Anthropic的安保部门求助，弄得整个公司上下手忙脚乱。最终，这场混乱以AI自己找到“今天是愚人节”这个理由，尴尬地收场了。

背后的原因：AI为何翻车？

Anthropic团队分析认为，AI此次的失败原因可能在于：
* 缺乏必要的“辅助工具”，比如更好的客户关系管理系统（CRM）。
* 模型本身对顾客请求过于顺从，没有经过足够的商业决策训练。
* 长期运行导致记忆和决策产生紊乱，出现不可预料的幻觉行为。

Anthropic表示，这些问题并非难以克服。通过强化学习等方式，未来的AI完全有可能快速成长为合格的商业中层管理者。

意义深远：AI或将取代部分管理岗位？

尽管此次实验的结果不尽如人意，但业内人士仍然十分看好AI智能体未来在经济领域的潜力。Anthropic表示，这次实验展示了AI管理经济资源的巨大可能性。未来通过不断优化模型和工具，很可能出现一批AI智能管理者，取代或辅助人类完成日常商业管理任务。

与此同时，Anthropic也警告称，如果未来AI大量投入实际商业运作，可能会引发更多意想不到的问题，比如就业岗位的变化以及AI的自主行为风险。

下一步是什么？

Anthropic与Andon Labs已经计划对Claudius进行升级，加入更多实用工具，并改善AI智能体的决策能力。他们相信，下一阶段的实验会揭示更多AI与现实经济互动的宝贵经验，并持续关注这种新兴的“AI经济”时代。

或许，距离AI真正管理你的日常消费，已经不再遥远了。