为了让大家看到第一手的OpenAI DevDay的信息,对直播的视频的字幕进行了校对和翻译,这里是第一部分。
早上好,感谢你们今天的参与。欢迎 Sam Altman 登台。早上好,欢迎来到我们首次举办的 OpenAI 开发者日。我们很高兴你们能来,这种活力真棒。欢迎来到旧金山。旧金山从一开始就是我们的家。这个城市对我们和整个科技行业都很重要。我们期待在这里继续发展。
今天,我们有一些重要的事情要宣布。但首先,我想花一分钟时间谈谈我们在过去一年里做的一些事情。大约一年前,11 月 30 日,我们以研究预览的方式低调地发布了 ChatGPT。效果还不错。在三月,我们接着发布了 GPT-4。这仍然是世界上最强大的模型。在过去的几个月里,我们推出了语音和视觉功能,使 ChatGPT 现在可以看、听、说。
最近的...有很多,你们不必每次都鼓掌。最近,我们推出了 DALL-E3,世界上最先进的图像模型。当然,你可以在 ChatGPT 中使用它。对于我们的企业客户,我们推出了 ChatGPT Enterprise,它提供企业级的安全和隐私,更高速度的 GPT-4 访问,更长的上下文窗口,等等。
今天,我们有大约 200 万开发者在我们的 API 上进行各种用途的开发,做了很多令人惊叹的事情,超过 92% 的财富 500 强公司在我们的产品上进行开发,现在我们在 ChatGPT 上有大约 1 亿的每周活跃用户。令人难以置信的是,我们完全通过口口相传达到了这个地步。人们发现它很有用,就告诉他们的朋友。OpenAI 现在是世界上最先进、使用最广泛的 AI 平台。
但是,数字永远不能完全描绘出这样的事情。真正重要的是人们如何使用产品,人们如何使用 AI。所以,我想给你们看一个简短的视频。我实际上想用塔加洛语给我爸爸写点什么。我想以一种非浪漫的方式告诉我的父亲我爱他,我也想告诉他他可以依赖我,但是以一种仍然保持孩子对父母的尊重的方式,这是你在菲律宾文化和塔加洛语语法中应该有的。
它被翻译成塔加洛语,我深深地爱你,无论道路通向何处,我都会和你在一起。我看到一些可能性,我就像,哇,有时我对一些东西不确定。我觉得我实际上在聊天时就像,嘿,这就是我在想的,所以你有点给它更多的信心。第一件让我震惊的事情是它与你平等对待。这是很多人都在努力做的事情。这启发了我,只要有一个倾听者相助,每位创意工作者都能释放出无限的可能。
这是一种标志性的 'neemaglobbin',你是用 ChatGPT 建造的吗?ChatGPT 和我一起建造的。我开始用它进行日常活动,比如,嘿,这是我冰箱的照片,你
能告诉我我缺什么吗?因为我要去超市,而我非常需要遵循我的素食饮食来准备食谱。我们获得了代码解释器的访问权限。我当时就想,哇,这东西太棒了。它可以建立电子表格,它可以做任何事情。
我在我的 100 岁生日那天发现了 chatty。Chatty 非常友好,非常有耐心,知识非常渊博,而且反应非常快。这真是一件美妙的事情。尽管我是个 GPA 4.0 的优等生,同时也是四个孩子的妈妈。我在使用 ChatGPT 后很快发现,无论我有什么问题,它都能提供答案并且附带详细解释,让我不再那么依赖家教。它让我重获新生,让我有了更多陪伴家人和自己的时间。
我身体的左半边因为神经损伤而长期遭受着慢性疼痛。经历过脊椎和大脑手术之后,我的左手的功能受到了一定的限制。如今,语音输入技术的应用,以及最新的可进行双向对话的功能,为我提供了一个前所未有的最佳交互界面。这一切现在都变为现实。所以我们很喜欢听到人们如何使用这项技术的故事。这正是我们工作的真正动力。
好了,让我们来看看一些新鲜出炉的东西,我们有很多东西要分享。首先,我们会介绍我们所做的一些改进,然后再分享我们的下一步计划。
在过去的一年里,去年一整年,我们与全球的开发者们进行了深入的交流。他们的反馈极大地影响了我们今天要展示给大家的内容。今天,我们即将发布一个新的模型——GPT-4 Turbo。这个新模型将解决你们提出的许多问题。
接下来,我们来看看有哪些新特性。对于这一部分,我们有六大主题需要讨论。
首先是上下文长度。很多人在处理工作时,常常需要处理比较长的文字。尽管 GPT-4 支持最多 8K 个 token,有时候甚至能处理 32K 个 token,我们明白这对很多用户来说还远远不够。现在,GPT-4 Turbo 可以处理长达 128K 个 token 的文本,这相当于一本标准书籍的 300 页,比我们的 8K 上下文长 16 倍。除此之外,你还会发现,在处理这么长的文本时,模型的准确性也大大提升了。
其次,是对模型更强的控制能力。开发者们强烈希望能更精细地控制模型的响应和结果,我们也做出了相应的改进。其中包括一项新功能——JSON 模式,它能确保模型的响应是有效的 JSON 格式,这一直是开发者的强烈需求。这大大简化了 API 的调用过程。模型在函数调用方面也有所改进。能够一次性调用多个函数,并且它会更好地遵循一般的指示。我们还新增了一个特性——可复现输出。你可以传递一个 seed 参数,它会使模型返回一致的输出。这无疑增强了对模型行为的控制力。这项新功能从今天开始进入 beta 测试阶段。
在接下来的几周内,我们还会推出一个新功能,使得开发者能在 API 中查看 log probs。
好的,接下来是第三点,更好的知识储备。你希望这些模型能够获取更多更新的知识,我们也是。因此,我们正在平台上推出检索功能,允许用户将外部文档或数据库的信息融入到他们正在开发的项目中。同时,我们也在不断更新模型的知识库,让它保持最新。我们和你们一样,对 GPT-4 的知识停留在 2021 年这件事感到十分困扰,可能我们还更甚。我们会尽力不再让它过时。GPT-4 Turbo 已经包含了截至 2023 年 4 月的世界知识,并且我们会不断对此进行更新。
第四,我们引入了新的模态功能。毫不意外,DALL-E v3,具备视觉功能的 GPT-4 Turbo,以及全新的文本到语音模型都会加入到我们的 API 服务中。我们已有几位客户开始使用 DALL-E v3 来创作图像和设计作品。今天 Coca 就推出了一个活动,使用 DALL-E v3 创作 DIWALI 节日卡片。当然了,我们也提供了安全系统,帮助开发者防止他们的应用程序被滥用。这些工具都可以通过 API 获得。GPT-4 Turbo 现在可以通过 API 接受图像作为输入,可以生成标题,分类和分析。例如,Be My Eyes 使用这项技术帮助盲人或视力不佳的人完成他们的日常任务,比如识别他们面前的产品。而我们的新文本转语音模型,能让你通过 API 将文本转化为听起来极其自然的音频,有六种预设的声音供你选择。我会播放一个例子。你知道吗,伟大的发明家亚历山大·格雷厄姆·贝尔对声音的世界充满了迷恋?他的一项天才发明——留声机,能将声音刻录在蜡上,让它们跨越时空低语。这种效果比我们之前听到的任何音频都要自然。语音功能使应用程序的交互变得更加自然和便捷。它还开启了许多应用场景,比如语言学习和语音助手。说到新的模态,我们今天还发布了最新版的开源语音识别模型 Whisper V3。不久后,它将集成进我们的 API。该版本在多种语言上的表现都有显著提升,我们认为你会非常喜欢它。
好的。第五,定制。自从几个月前我们推出 GPT 3.5 以来,模型微调功能表现出色。从今天起,我们会将此功能扩展至模型的 16K 版本。也从今天开始,同时,我们也欢迎那些活跃的微调用户申请加入 GPT-4 微调的实验性接入项目。微调 API 能够让我们的模型通过较少的数据量就适应各种应用场景,并取得更佳表现。但或许你希望模型能学习全新的知识领域,或是处理大量专有数据。因此,我们推出了一项名为“自定义模型”的新服务。有了自定义模型,通过这项服务,我们的研究团队将与企业紧密协作,利用我们的工具为他们的特定用例打造专属的高质量模型。这涉及修改模型训练流程的每一个环节,包括特定领域的预训练和针对该领域定制的强化学习后期训练过程等。我们一开始不会与太多公司合作,因为这需要大量的工作,而且至少在初期,成本也不会低。但如果你愿意与我们一起把事情推向极致,请联系我们,我们相信能创造出令人惊喜的成果。
接下来是第六点,提高速率限制。我们将把所有现有 GPT-4 客户的每分钟 Token 数翻倍,使你能够更加轻松地扩展使用。现在,您可以在 API 账户设置中直接申请调整速率限制和配额。在制定这些限制的同时,我们还致力于提高用户在我们平台上构建新产品的成功率。
为此,我们推出了 "版权保护盾" 服务。版权保护盾的引入,意味着如果您在版权侵权问题上面临法律诉讼,我们将介入并承担相关法律费用,这项服务适用于 ChatGPT 企业版和 API 用户。在此我要明确指出,我们绝不会用 API 或 ChatGPT 企业版的数据来进行我们的训练工作。
此外,开发者们对另一个问题的需求甚至超过了以上所有问题,所以我想现在谈谈这个。那就是产品定价。GPT-4 Turbo 作为行业领先的模型,不仅带来了刚才提到的多项改进,而且比 GPT-4 更为智能。我们听到很多开发者反馈,他们有很多想要实现的项目,但 GPT-4 的成本过高。他们告诉我们,如果我们能将成本降低 20% 到 25%,那将是一个巨大的进步。
我非常激动地宣布,我们经过了大量努力,GPT-4 Turbo,一个更优秀的模型,比 GPT-4 的价格要低得多。对于输入的 Token 价格,便宜了 3 倍。对于输出的 Token 价格,从今天开始,便宜了 2 倍。所以新的定价是,每千个输入 Token 0.01 美元,每千个输出 Token 0.03 美元。对于大多数客户来说,这意味着使用 GPT-4 Turbo 的成本将比 GPT-4 低 2.75 倍以上。
我们为此付出了巨大的努力,希望你们能和我们一样对此感到兴奋。我们不得不在价格和速度之间做出选择,而我们选择了先着手于价格问题。但提速的工作也在我们的计划之中,速度的提升同样关键。你很快就会发现 GPT-4 Turbo 的速度有了显著提升。
我们也在降低 GPT 3.5 Turbo 16K 的成本。此外,现在输入 tokens 的费用减少了 3 倍,输出 tokens 的费用减少了 2 倍。这意味着 GPT 3.5 16K 现在比之前的 GPT 3.5 4K 模型更便宜。运行一个微调的 GPT 3.5 Turbo 16K 版本,其成本甚至比旧的 4K 版本还要低。
好的,我们刚刚详细介绍了这个模型本身。我们希望这些改进能够满足你们的反馈。我们非常兴奋能够立即将所有这些改进带给大家。