OpenAI CEO Sam Altman 与 GPT-5 团队 Reddit AMA(你问我答)精华摘要 (2025年8月8日)
发布初期的风波与技术修复
- GPT-5 发布之初遇到了严重的技术问题,包括自动切换器在当天大部分时间里都处于宕机状态,这导致模型看起来比实际要笨得多。不过,团队目前正在对决策边界进行干预,以确保用户能更频繁地用到正确的模型,并增加透明度,让用户知道究竟是哪个模型在回答每一个问题。
- 此次大规模的发布导致 API 流量在 24 小时内翻倍,为数亿用户带来了服务中断问题。但团队预计,随着他们持续进行修复,一切将在未来一两天内恢复稳定。在完成全部署的同时,他们也正在为 Plus 用户提供双倍的速率限制。
- 团队遇到了模型路由器(model router)的 bug,它没能将代码相关的查询正确地引导至“思考”模型,这导致在处理编程任务时,GPT-5 看起来像是降级了。这种情况直到用户手动触发推理模式,或明确要求模型“努力思考”后才有所改善。
- 直播发布会上出现了人为失误,由于团队成员加班到深夜、身心俱疲,导致演示中的柱状图存在误导性。不过,博客文章和系统卡片中提供的实际数据是准确无误的。
- 目前,模型切换器是根据任务的领域和复杂性来决定使用哪个模型的,但它不会预先进行网络搜索,因为那样会大大增加延迟。
用户访问权限与模型选项
- OpenAI 听到了大量希望 GPT-4o 回归的强烈呼声,并将为 Plus 用户恢复其使用权限,同时会密切关注其使用情况,以决定是否长期保留这一选项。
- 团队正在开发 GPT-5-mini,以恢复用户之前在使用 o3、o4-mini-high 和 o4-mini 时所享有的同等推理使用额度。因为移除 mini 版本后,用户的总推理能力大幅下降。GPT-5-mini 正在逐步向用户推送。
- 理论上,Plus 用户应该可以无限制地使用 GPT-5。任何遇到速率限制的用户,都被团队视为遇到了一个需要调查修复的 bug。
- 团队正在探讨用户是否真的需要同时使用 4o 和 4.1 两个版本,或者只保留 4o 是否就足够了。他们也在考虑在目前 20 美元的 Plus 套餐和 200 美元的 Pro 套餐之间,增设一个新的定价档位。
- 团队正在进行用户界面(UI)的改动,让用户能更容易地手动触发“思考”模式,并考虑增加通过自定义指令来强制模型进行“思考”的功能。
安全性与内容过滤的改进
- 团队正在积极修复在生物安全领域出现的过度标记问题,这些问题曾错误地阻止了关于基因疗法和生物工程等领域的合法学术研究。同时,他们通过“生命科学研究特殊访问计划”为经过审查的用户提供服务,以维持必要的防范措施,防止技术被滥用于存在双重用途风险的领域。
- 此前,内容过滤系统有时会将学习历史主题(如艺术家或历史人物)的用户错误地标记出来,该系统正在得到改进。不过团队也承认,要精准区分有益的教育内容和有害信息确实是一个巨大的挑战。
编程能力与相关工具
- Codex CLI(命令行工具)现在通过付费的 ChatGPT 计划支持 GPT-5。其使用限制的设计目标是让 Pro 用户几乎不会遇到瓶颈,而 Plus 和 Team 用户每周可以进行数次长达 1-2 小时的编程会话。速率限制每 5 小时重置一次,并设有每周总量控制。
- 团队计划将 GitHub 直接集成到普通的 ChatGPT 对话中,用户无需再切换到深度研究模式或 AI 智能体模式。
- 用于编程的 Canvas 功能正在持续改进,Codex 也即将迎来重大升级。GPT-5 的“思考”模式尤其擅长处理复杂的推理问题、大规模代码重构,以及从零开始构建完整的应用程序,包括功能性的前端界面。
- GPT-5 在 API 中的工具使用和函数调用能力得到了增强。团队正在考虑为 API 提供 GPT-5 Pro 版本,但指出它会很慢且价格昂贵。目前没有将 GPT-5 Pro 引入 Codex CLI 的具体计划。
- OpenAI 内部的开发人员会使用包括 Codex、Cursor 在内的多种编码工具,并且正在为模型训练构建内部调试工具。有了 GPT-5 的帮助,这项工作变得容易多了。
模型特性与未来规划
- 相较于 GPT-4,GPT-5 在推理、创意写作、指令遵循、减少幻觉、医疗保健和视觉感知方面都取得了巨大的进步。预计 GPT-5“思考”模式的写作质量会比 GPT-4.5 更出色、更有趣。团队相信,从 GPT-4 到 GPT-5 的飞跃,其意义不亚于从 GPT-3 到 GPT-4 的跨越。
- 这个模型有一些古怪的特性,比如在网站设计中对紫色有强烈的偏好,以及在它的思考链(chain of thought)中总喜欢说“让我们精心打造”(let's craft)。这些怪癖后来成了团队内部的趣谈和加油口号。
- 记忆功能即将迎来改进。一旦用户设定了引导偏好,模型就会记住它们。并且,很快就会有激动人心的、专门针对记忆功能的更新发布。
- OpenAI 发布了一款新的语音模型,它在遵循指令和响应速度方面表现更佳。高级语音模式将向所有免费用户开放,并计划使其更加多模态,能够在对话时显示有用的信息。
- 团队非常希望扩展上下文窗口(他们曾希望为 GPT-5 实现 100 万 token 的上下文窗口),但目前受限于计算成本和 GPU 容量。目前,Pro 用户获得 128k 的上下文额度,而 Plus 用户为 32k。
- 团队正在努力在不久的将来,将推理模型和非推理模型统一成一个单一的模型,并考虑采用基于 token 的定价方式,而非目前基于消息数量的限制。
- 未来的计划包括通过语音,甚至在更遥远的未来通过神经接口,来实现无屏幕访问。最终目标是帮助用户在电子设备上花费更少的时间,同时获得更多价值。
- 团队在各种平台上测试了不同的模型快照,包括代号为“Summit”和“Zenith”的版本。最终,Summit 在排行榜和内部测试中都以巨大优势胜过了 Zenith。