麻省理工学院 NANDA 研究发现,仅有 5% 的组织成功将 AI 工具大规模投入生产
美国公司已在生成式 AI 项目上投资了 350 亿至 400 亿美元,然而到目前为止,几乎血本无归。
根据麻省理工学院 NANDA(网络 AI 智能体与去中心化人工智能)项目的一份报告 [PDF],95% 的企业组织从他们的 AI 投入中获得了零回报。
只有 5% 的组织成功地将 AI 工具大规模集成到生产中。
该报告基于对 52 位企业领导者的结构化访谈、对 300 多个公开 AI 项目和公告的分析,以及对 153 位商业专业人士的调查。
报告作者——Aditya Challapally、Chris Pease、Ramesh Raskar 和 Pradyumna Chari——将这种“生成式 AI 鸿沟”归因于 AI 系统无法保留数据、适应环境以及持续学习的能力,而非基础设施、学习资源或人才的匮乏。
“生成式 AI 鸿沟”在部署率上表现得最为明显,只有 5% 的定制化企业 AI 工具能够进入生产阶段。
“‘生成式 AI 鸿沟’在部署率上表现得最为明显,只有 5% 的定制化企业 AI 工具能够进入生产阶段,”报告称。“聊天机器人之所以成功,是因为它们易于尝试且灵活,但在关键工作流程中却因缺乏记忆和定制化能力而失败。”
正如一位匿名的首席信息官在接受作者采访时所说:“今年我们看了几十个演示。可能只有一两个是真正有用的。其余的要么是‘套壳’产品,要么就是科学实验项目。”
作者的发现与其他近期研究的结果不谋而合,这些研究表明,企业领导层对 AI 项目的信心正在下降。
NANDA 的报告确实提到,一小部分公司已经发现生成式 AI 的用处,并且该技术正在对九个工业领域中的两个——科技以及媒体与电信——产生实质性影响。
而对于其余领域——专业服务、医疗保健与制药、消费与零售、金融服务、先进工业以及能源与材料——生成式 AI 则一直无关紧要。
报告援引了一位中端市场制造企业匿名首席运营官的话:“LinkedIn 上的宣传天花乱坠,说一切都改变了,但在我们的实际运营中,没有任何根本性的变化。我们处理一些合同的速度是变快了,但仅此而已。”
有一件事确实在改变,那就是就业格局,至少在受影响的行业是如此。报告指出,在科技和媒体领域,“超过 80% 的高管预计在 24 个月内会缩减招聘规模。”
据作者称,由生成式 AI 驱动的裁员主要发生在那些经常被外包的非核心业务活动中,例如客户支持、行政处理和标准化的开发任务。
“这些职位在 AI 实施之前,就因其外包状态和流程标准化而显示出脆弱性,”报告称,并指出在受影响的行业中,有 5% 到 20% 的支持和行政处理岗位受到了冲击。
据《The Register》获悉,甲骨文(Oracle)最近的裁员反映了其平衡 AI 资本支出的努力,而这笔开支已成为美国科技巨头脖子上的沉重负担。而在 IBM,员工们则认为 AI 已被用作将工作岗位转移到海外的借口。
无论裁员的公开理由和真实动机是什么,生成式 AI 确实正在对科技以及媒体与电信行业产生影响,这些也是它被最广泛采用的领域。
尽管大约 50% 的 AI 预算被分配给了市场营销和销售,但报告作者建议,企业投资应该流向那些能产生有意义业务成果的活动。这包括前端的潜在客户资格鉴定和客户维系,以及后端的削减业务流程外包、广告代理支出和金融服务风险核查。
报告通过分析生成式 AI 在某些公司取得成功的方式指出,像 OpenAI 的 ChatGPT 这样的通用工具,表现要优于定制的企业级工具,即便这些企业工具底层使用的是相同的 AI 模型。
报告阐述的理由是,员工往往对 ChatGPT 的界面更熟悉,因此使用得更多——这是员工自发的“影子 IT”所导致的结果。报告引用了一位公司律师的访谈,她描述了自己所在的中型律所对一款花费了 5 万美元的专业合同分析工具的不满。
“我们购买的 AI 工具提供的摘要非常刻板,定制选项也很有限,”这位律师告诉研究人员。“而使用 ChatGPT,我可以引导对话,反复迭代,直到获得我确切需要的东西。根本性的质量差异是显而易见的,ChatGPT 始终能产出更好的结果,尽管我们的供应商声称他们用的是同样的基础技术。”
作者们认为,那些成功跨越“生成式 AI 鸿沟”的公司,在采购 AI 时,更像是在采购业务流程外包服务,而不是软件即服务(SaaS)的客户。
“他们要求深度定制,从一线推动应用,并要求供应商对业务指标负责,”报告总结道。“最成功的买家明白,跨越这条鸿沟需要的是建立合作关系,而不仅仅是购买产品。”®