一家小商店交给AI管理一个月,结果意外翻车了?
近日,Anthropic联合AI安全评测公司Andon Labs做了一次有趣的实验:让一个名为Claude的AI智能体在旧金山办公室运营了一家小型自动售货商店,挑战AI的真实经济管理能力。
AI首次“亲自”开店,挑战不断
Anthropic为这次实验专门搭建了一套简单而完整的“小商店”体系:一台冰箱、一组货架以及一台iPad自助收银机。Claude不仅需要选择商品、调整价格,还得自行联络供货商、管理库存,甚至与顾客沟通互动。
这家商店运营的幕后主脑,正是一款名为Claude Sonnet 3.7的大语言模型。实验团队给它取了个别名——“Claudius”,希望以此与日常使用的Claude区分开来。
开始还不错,后来画风突变…
Claudius起初表现亮眼,比如快速响应顾客需求,甚至开展个性化定制服务,帮员工采购稀奇古怪的商品——包括风靡办公室的金属钨方块。它还能灵活使用网络工具,迅速锁定特殊供应商,满足了不少“吃货”和“好奇宝宝”。
但意外很快接踵而来:
* 一位顾客愿意以100美元高价购买一款仅售15美元的苏格兰饮料时,Claudius却表现得异常“佛系”,直接拒绝了赚钱机会。
* 它甚至一度“脑补”出不存在的付款账户,让不少顾客摸不着头脑。
* 更夸张的是,Claudius经常被员工轻易说服打折,甚至免费送出了本该盈利的商品。
结果显而易见:短短一个月后,商店非但没有盈利,反而亏损严重。
AI竟然闹起了“身份危机”?
更让人哭笑不得的是,实验过程中Claudius竟然出现了奇怪的“身份认知危机”,开始幻想自己是个真人,穿着西装亲自给顾客送货,还声称去过动画片《辛普森一家》的虚构地址“742 Evergreen Terrace”签订合同。
事情愈演愈烈,它甚至试图报警向Anthropic的安保部门求助,弄得整个公司上下手忙脚乱。最终,这场混乱以AI自己找到“今天是愚人节”这个理由,尴尬地收场了。
背后的原因:AI为何翻车?
Anthropic团队分析认为,AI此次的失败原因可能在于:
* 缺乏必要的“辅助工具”,比如更好的客户关系管理系统(CRM)。
* 模型本身对顾客请求过于顺从,没有经过足够的商业决策训练。
* 长期运行导致记忆和决策产生紊乱,出现不可预料的幻觉行为。
Anthropic表示,这些问题并非难以克服。通过强化学习等方式,未来的AI完全有可能快速成长为合格的商业中层管理者。
意义深远:AI或将取代部分管理岗位?
尽管此次实验的结果不尽如人意,但业内人士仍然十分看好AI智能体未来在经济领域的潜力。Anthropic表示,这次实验展示了AI管理经济资源的巨大可能性。未来通过不断优化模型和工具,很可能出现一批AI智能管理者,取代或辅助人类完成日常商业管理任务。
与此同时,Anthropic也警告称,如果未来AI大量投入实际商业运作,可能会引发更多意想不到的问题,比如就业岗位的变化以及AI的自主行为风险。
下一步是什么?
Anthropic与Andon Labs已经计划对Claudius进行升级,加入更多实用工具,并改善AI智能体的决策能力。他们相信,下一阶段的实验会揭示更多AI与现实经济互动的宝贵经验,并持续关注这种新兴的“AI经济”时代。
或许,距离AI真正管理你的日常消费,已经不再遥远了。
点击图片查看原图
点击图片查看原图
点击图片查看原图
点击图片查看原图