TheInformation:苹果为何在 AI 人才争夺战中节节败退(原因不止是钱)
一场旨在解决公司 AI 难题的苹果大规模重组,反而导致核心研究员纷纷投奔竞争对手。
核心要点
• 苹果基础模型团队的成员正考虑离职,以期在其他公司追求更宏伟的 AI 目标。
• 在前负责人庞若鸣(Ruoming Pang)离职后,苹果领导层已讨论为留下的团队成员提高薪酬。
• 该团队与苹果管理层在模型开源问题以及 AI 战略模糊不清等方面存在分歧。
---
今年早些时候,负责苹果人工智能模型的团队希望将其中几款模型作为开源软件发布。这样做既能展示苹果在 AI 领域的技术进步,也能借助外部研究人员的力量来改进模型。然而,此举同样会向公众暴露,当苹果为了适配 iPhone 而缩减模型尺寸后,其性能相较于为更强大的个人电脑或数据中心计算机设计的版本,出现了多么显著的下降。
据两位知情人士透露,苹果的软件主管克雷格·费德里吉(Craig Federighi)并不同意走开源路线。他在一封邮件中告诉苹果基础模型团队的负责人庞若鸣,市面上已有足够多来自其他公司的开源模型来激励研究。尽管将模型开源会显示出该软件在性能上不如阿里巴巴和谷歌的某些竞品模型,但费德里吉表示,他更担心的是公众会认为苹果为了让软件在 iPhone 上运行而做出了太多妥协。1
这一事件凸显了苹果内部日益加剧的紧张关系:一方是更具研究思维的基础模型团队,另一方是费德里吉领导的、以产品为中心的软件部门。自三月份的一次重组后,费德里吉的部门开始主导公司的 AI 战略和 Siri 语音助手。这次重组的背景是,一款由 AI 驱动的新版 Siri 发布遭遇了令人尴尬的延迟,同时苹果为 iPhone 发布的一系列其他 AI 功能也反响平平。
苹果能否在 AI 领域站稳脚跟,一个重要因素在于其吸引和留住顶尖研究员的能力。而在这方面,它近来一直在失利。
上周,庞若鸣在 LinkedIn 上宣布,他已离开苹果,转投 Meta Platforms。此前,他是苹果基础模型团队的负责人。据彭博社报道,庞若鸣在 Meta 未来四年的收入可能高达 2 亿美元。
庞若鸣团队的一些成员已经开始追随他前往 Meta。据两位知情人士透露,其中一位是汤姆·冈特(Tom Gunter)。他最近刚离开苹果准备加入 OpenAI,但在庞若鸣被 Meta 聘用后,他突然改变主意,也加入了 Meta。冈特于 2017 年加入苹果,是公司内部最早探索大语言模型的人员之一,并经常作为庞若鸣团队的代表出现在公司级的大型活动中。
知情人士还表示,苹果基础模型团队(由几十人组成)的其他成员也正在寻找加入 OpenAI 和 Anthropic 等公司的机会。
对于许多研究人员来说,在这场历史性的 AI 人才争夺战中,其他公司开出的令人瞠目结舌的薪酬无疑是他们决定离开苹果的部分原因。
据两位了解该团队情况的人士透露,在庞若鸣宣布离职后,苹果领导层告诉留下的基础模型团队,公司正在重新评估薪酬体系,可能会为成员提供更多资金以挽留他们。从历史上看,苹果向员工提供的薪酬不如其他大型科技公司,它更多地是依靠其品牌影响力和在消费科技领域的巨大影响力来吸引人才。
但除了钱,还有其他因素。
据该团队的前成员透露,像其他公司的研究人员一样,苹果基础模型团队的许多成员都渴望站在 AI 的最前沿——特别是追求其终极目标:超级智能,这是一个用来描述 AI 能够匹敌甚至超越人类能力的术语。相比之下,他们表示,费德里吉的团队更专注于改进 AI 模型,以用于写作和总结等日常应用场景。
“拥有使命感和明确的目标,一直是吸引 AI 人才的有效方式。”阿里·法哈迪(Ali Farhadi)说,他曾于 2023 年前在苹果的 AI 团队工作,现在是非营利组织艾伦人工智能研究所(Allen Institute for AI)的首席执行官。
AI 人才的流失可能会危及苹果在 AI 领域追赶的进程,并加深其对外部 AI 合作伙伴的依赖。
据《The Information》此前报道,费德里吉接手后,指示 Siri 团队研究使用外部公司而非庞若鸣团队构建的模型。熟悉合作谈判的人士表示,该公司正在评估来自 OpenAI、Anthropic 和谷歌的外部模型,以驱动一个改进版的 Siri。
知情人士称,苹果有意与外部伙伴合作,这进一步让庞若鸣团队的一些成员感到心灰意冷。
ChatGPT 引发的仓促应对
苹果在 AI 领域的挑战由来已久。虽然苹果早在 2011 年就通过发布 Siri 将 AI 变成了大众市场产品,但多年来,该公司一直难以跟上 AI 的前沿发展,也难以吸引该领域的顶尖人才。
随着时间的推移,它做出了一些让步,为 AI 研究人员创造一个更具吸引力的环境。2018 年,它从谷歌挖来了约翰·贾南德雷亚(John Giannandrea),负责苹果更广泛的 AI 战略,他对 Siri 特别感兴趣。在他上任后,公司开始鼓励研究人员更频繁地发表他们的 AI 发现,这与其保密的文化背道而驰。
与科技界的许多公司一样,苹果对 2022 年末 OpenAI 发布的 ChatGPT 感到措手不及。起初,贾南德雷亚的团队并未以太大的紧迫感来应对。这为费德里吉软件团队的成员创造了机会,他们利用 OpenAI 的模型制作了一些演示,展示了 AI 如何实现更具对话性的语音交互和对 iPhone 的控制。尽管苹果也涉足了其他公司的技术,但它仍致力于构建自己的大语言模型来支持这类 AI 功能。
构建这些模型的任务落在了庞若鸣的基础模型团队身上,该团队隶属于贾南德雷亚的 AI 部门。
在 ChatGPT 发布前一年,贾南德雷亚和他手下的高级副手(其中许多人是从谷歌跟随他过来的)从谷歌 DeepMind 招募了庞若鸣,负责苹果构建基础模型的工作。庞若鸣带来了他在开发和训练大规模 AI 系统方面的丰富专业知识,这涵盖了从模型本身到其背后的支持软件等所有方面。
苹果允许庞若鸣在纽约工作,而没有强迫他搬到加州库比蒂诺的总部——对于这样一个关键职位来说,这是一种罕见的举动。起初,后来成为基础模型团队的那个小组规模很小,只有少数几名研究员。一些现有的苹果员工加入了进来,比如冈特,但庞若鸣也从谷歌 DeepMind、Meta、微软和亚马逊招募了人才。
到 2022 年末 ChatGPT 的发布让全世界为之着迷时,庞若鸣已经在苹果构建出了大语言模型。然而,贾南德雷亚却将它们搁置了,因为他不相信这项技术的实用性。
随着 ChatGPT 的重要性在整个行业内深入人心,苹果高管们意识到公司需要迅速跟上这项技术。2023 年,苹果正式成立了基础模型团队,由庞若鸣担任负责人。
该团队成立一年后,已发展到 40 名研究员。庞若鸣向新加入的成员承诺,他们将获得苹果计算基础设施的最高优先级访问权限,以便训练模型。在当时整个行业因 AI 芯片需求激增而面临短缺的情况下,这是一个极具吸引力的前景。一位知情人士表示,苹果的管理人员曾讨论过保持团队增长的方法,比如直接招募整个学术界或工业界的 AI 实验室。
尽管管理着一个日益壮大的 AI 研究团队,庞若鸣仍以其对技术事务的持续深入参与而闻名。据一位知情人士透露,他在冬歇期间亲自编写了 AXLearn(苹果用于训练其大型 AI 系统的开源工具)的原型代码,以证明其可行性。
2024 年 6 月,该公司发布了 Apple Intelligence,这是一套由生成式 AI 驱动的新 AI 功能套件,其技术基础正是由庞若鸣的团队开发的。这个新系统包括写作和图像生成工具,与 ChatGPT 集成以回答问题,以及最重要的是,一个更强大的 Siri,苹果表示将在稍后发布。
尽管公司发布了这些功能,但基础模型团队感到高层管理缺乏明确的方向。虽然公司有为苹果内部构建最佳 AI 模型的宏大目标,但团队成员并不知道他们应该专注于哪种类型的模型——无论是用于文本理解、语音还是图像。
团队成员感到失望的是,苹果设定的目标仅仅是追平 ChatGPT 的能力,而不是更具雄心。高层管理甚至向基础模型团队的一些成员征求关于苹果可以开发什么产品的想法,这加剧了团队对缺乏整体产品愿景来指导 AI 战略的担忧。
外部模型
尽管如此,在 2025 年初,庞若鸣团队的一些成员对他们在苹果基础模型上的技术进展感到满意。他们相信自己正按计划交付一个能够驱动新版 Siri 的模型,以赶上苹果原定于 2025 年 4 月推出的目标。该团队构建了一个功能性的 AI 系统,能够处理来回对话、回答问题并使用 Siri 完成任务。
今年早些时候,他们向贾南德雷亚和 Siri 团队展示了这个功能的演示。在整个会议期间,他大部分时间都保持沉默。但最后,他给出了一个热情的反应。
“这是公司的未来,”据一位直接了解会议情况的人士透露,他当时这样说道。“这很重要。你们做得很好。继续努力。”
这份热情并没有持续多久。今年 3 月,苹果发布消息称,将新版 Siri 推迟到 2026 年的某个时候。
这个消息让庞若鸣团队的一些成员感到震惊。过去,这个团队在很大程度上可以自由地进行工作,不受苹果其他部门的干扰,但这也意味着他们与决策过程脱节。因此,据一位前成员透露,团队没有被征求关于延迟的意见,也没有被告知他们的模型到底出了什么问题(如果有的话)。
苹果宣布延迟后不久,首席执行官蒂姆·库克将 Siri 团队从贾南德雷亚手中移交给了费德里吉和迈克·罗克韦尔(Mike Rockwell),后者是领导 Vision Pro 头显开发的苹果高管。庞若鸣的团队则继续留在贾南德雷亚的领导下。
庞若鸣试图安抚他的团队,告诉他们要专注于团队的使命——为整个苹果构建最好的 AI 模型。直接向贾南德雷亚汇报并协助管理基础模型团队的达芙妮·梁(Daphne Luong)也前来稳定军心。据知情人士透露,她告诉庞若鸣的团队,导致这次重组的问题出在 Siri 身上,而不是苹果的 AI 模型。
但新的进展很快削弱了这些安抚之词。今年 6 月,彭博社报道称,Siri 团队正在评估如果采用来自 OpenAI、Anthropic 或谷歌的外部 AI 模型,这款语音助手的表现会如何(知情人士证实了这一举动)。据与他们交谈过的人士透露,一些前团队成员感到士气低落,并开始考虑离开苹果。
据现任和前任员工称,庞若鸣的离职在苹果内部引发了一场地震。
许多人因庞若鸣的技术知识、职业道德和乐于奉献时间的精神而尊重他。据前员工称,他的团队成员也觉得他在苹果内部保护了他们。现任和前任苹果员工预测,没有他的存在,将会有更多的研究人员离职。
长期在谷歌工作的工程师陈志峰(Zhifeng Chen)最近加入了苹果,现在将领导基础模型团队。
在 LinkedIn 的告别帖中,庞若鸣重点介绍了他前团队发表的一篇新研究论文,该论文表明苹果在缩小模型以使其在 iPhone 上良好运行方面取得了进展。
“这对我来说是一篇苦乐参半的帖子,因为我昨天离开了苹果,”庞若鸣写道。“最难的部分是离开这个在过去四年里凝聚在一起的紧密团队。”
点击图片查看原图
点击图片查看原图
点击图片查看原图