摘自张小珺 的《老黄现场实录:“我当过全世界最没价值的CEO,也当过最有价值的”》的三段对话:
北京时间7月16日,黄仁勋今年的第三次访华期间,出席媒体见面会。他谈及DeepSeek、开源、AI安全、雷军、华为、竞争等问题。
Q:有人说,大模型的 scaling law(扩展规律)正在失效,所以未来的研究架构不需要那么多算力了。你怎么看?
黄仁勋:哦,那是对 DeepSeek R1 的错误理解。
DeepSeek R1 是一个非常创新的新架构,它非常高效。DeepSeek R1 的架构很有创新性,因此每个 token 所需的计算量要低很多。但它之所以要这样,是因为 DeepSeek 是为 reasoning(推理)设计的。它需要思考很多次,所以每生成一个 token 都要非常高效,这样整个思考过程才能高效。
他想得很快,他也想得很久,所以当你要思考很久的时候,越快越好。
这也是为什么 DeepSeek 是一个革命性的突破——不是因为你现在不需要那么多算力了,而是因为你现在可以思考很久,得出很多结论。所以它实际上开启了一个全新的领域,叫做 Agentic AI(智能体式AI),这是非常重要的。
推理模型未来会更多地被用在云端,也会被用在边缘端(edge)。你为什么需要在边缘用 reasoning 模型?因为,比如一辆自动驾驶车遇到它从没见过的情况,这时候它需要“思考”:眼前是什么?我该怎么做?
它会进行 reasoning,而不是简单地说“我会开”或者“我不会开”。
今天的车太简单了。未来带 reasoning AI 的车能够真正“思考”。
所以未来你会在边缘有 thinking AI(会思考的 AI),在云端也会有 thinking AI,但也会有一些非常简单的 AI,比如开门那种,就可以很简单。所以一切都取决于具体应用。
Q:你使用DeepSeek吗?
黄仁勋:我只用这几个 AI 工具:OpenAI、Gemini Pro、Claude和 Perplexity。我几乎是同时使用这4个 AI 的。
我会给它们同一个问题,然后让它们给出第二种看法(second opinion),它们可以互相参考彼此的答案,进一步提升结果质量。
我就是这样使用它们的。我认为未来这也是一种安全机制——你会有很多不同的 AI,它们之间会形成冗余、平衡和交叉验证的机制。
在中国,也会是这样。
Q:中国的 AI 发展与美国的 AI 发展有何不同?
黄仁勋:DeepSeek R1,它既是一个革命性的模型,也是第一个开源的推理模型,而且非常高效,因为它是开源的。
许多公司和国家都下载了 DeepSeek R1。很多人使用 DeepSeek API,其中99%的人下载了开源模型,并将其适配到自己的应用中。
全世界各地,我们看到它被应用于各种不同领域,比如医疗保健和医学影像、机器人领域,等等。
正因为开源,才让每个行业、每个国家都能参与进来。
AI 不应该只是属于少数人或者少数国家,AI 是属于所有人的。全世界每一个人都应该,也都会从 AI 的能力中受益。
AI 会提升整个社会。正如你所知,AI 是人类迄今为止拥有的最伟大的技术,也是最强大的“平权器”(equalizer)。
你可以证明这一点:有了 AI,一个贫穷的艺术家也能成为相当不错的艺术家;有了 AI,一个贫穷的作家也能成为很好的作家。
所以我们在提升每个人的能力,缩小差距。
关于 AI 开源,我最后想说的是,因为它是开源的,所以能吸引来自全球范围内庞大的产业和社区的科学审查。这种公开透明的审查,有助于提高 AI 的安全性。
完整内容见引用
点击图片查看原图
点击图片查看原图