OpenAI 发布 GPT-5.5 Instant 模型,幻觉率暴降 52.5%,回答字数减少 30.2%,全量免费开放给所有 ChatGPT 用户。


OpenAI 发布 GPT-5.5 Instant 模型,幻觉率暴降 52.5%,回答字数减少 30.2%,全量免费开放给所有 ChatGPT 用户。
OpenAI 正式发布 GPT-5.5 Instant,即日起向所有 ChatGPT 用户逐步推出,取代 GPT-5.3 Instant 成为默认模型。这次更新的重点不是"更聪明",而是"更靠谱、更简洁、更像人"。

GPT-5.5 Instant 是 OpenAI 面向日常交互场景的最新模型,定位为 ChatGPT 的默认模型。它在三个方向做了针对性优化:降低幻觉率、精简回答长度、增强记忆和个性化能力。API 中的模型名称为 chat-latest。
在医学、法律、金融等专业领域的高难度对话场景中,GPT-5.5 Instant 的幻觉率(不实回答占比)比 GPT-5.3 Instant 减少了 52.5%。在用户曾标注存在事实错误的对话场景中,不实回答占比降低了 37.3%。
这意味着你拿它查资料、做翻译、写专业文档时,出错概率大幅下降。

基准测试成绩提升一览:
| 测试项目 | 提升幅度 |
|---|---|
| 科学图表推理 (CharXiv-reasoning) | +6.6% |
| 多模态专家推理 (MMMU-Pro) | +6.8% |
| 文档解析 (错误率降低) | -14.4% |
| 博士级科学问答 | +7.1% |
| 数学竞赛 (AIME 2025) | +15.8% |
GPT-5.5 Instant 的回答更加紧凑,字数减少 30.2%,行数减少 29.2%。模型会减少不必要的追问,避免随意添加表情符号,保持非正式但实用的语气。简单说:废话少了,干货多了。
模型现在能利用过往聊天记录、上传文件和 Gmail 中的上下文信息,让回答更具个性化。关键改进:

chat-latest这次更新本质上是一次"体验型升级"。在大模型基础能力趋于收敛的背景下,OpenAI 选择在"让回答更让人舒服"这个方向发力。幻觉减少和回答精简是最直接可感知的变化,而记忆来源功能则为长期使用建立了信任基础。

登顶OpenRouter全球调用榜首的开源Agent,具备自我学习、持久记忆和技能进化能力,一条命令即可部署。

GPT-5.5加持的Codex单周下载量突破9000万,Token效率提升40%,16人团队月省3.2万美元,开发者正在用脚投票。

Claude深度集成微软Excel、PowerPoint、Word和Outlook,支持跨应用连续工作流,对话记忆在所有Office应用中共享。