OpenAI 发布 GPT-5.5 Instant 模型,幻觉率暴降 52.5%,回答字数减少 30.2%,全量免费开放给所有 ChatGPT 用户。


OpenAI 发布 GPT-5.5 Instant 模型,幻觉率暴降 52.5%,回答字数减少 30.2%,全量免费开放给所有 ChatGPT 用户。
OpenAI 正式发布 GPT-5.5 Instant,即日起向所有 ChatGPT 用户逐步推出,取代 GPT-5.3 Instant 成为默认模型。这次更新的重点不是"更聪明",而是"更靠谱、更简洁、更像人"。

GPT-5.5 Instant 是 OpenAI 面向日常交互场景的最新模型,定位为 ChatGPT 的默认模型。它在三个方向做了针对性优化:降低幻觉率、精简回答长度、增强记忆和个性化能力。API 中的模型名称为 chat-latest。
在医学、法律、金融等专业领域的高难度对话场景中,GPT-5.5 Instant 的幻觉率(不实回答占比)比 GPT-5.3 Instant 减少了 52.5%。在用户曾标注存在事实错误的对话场景中,不实回答占比降低了 37.3%。
这意味着你拿它查资料、做翻译、写专业文档时,出错概率大幅下降。

基准测试成绩提升一览:
| 测试项目 | 提升幅度 |
|---|---|
| 科学图表推理 (CharXiv-reasoning) | +6.6% |
| 多模态专家推理 (MMMU-Pro) | +6.8% |
| 文档解析 (错误率降低) | -14.4% |
| 博士级科学问答 | +7.1% |
| 数学竞赛 (AIME 2025) | +15.8% |
GPT-5.5 Instant 的回答更加紧凑,字数减少 30.2%,行数减少 29.2%。模型会减少不必要的追问,避免随意添加表情符号,保持非正式但实用的语气。简单说:废话少了,干货多了。
模型现在能利用过往聊天记录、上传文件和 Gmail 中的上下文信息,让回答更具个性化。关键改进:

chat-latest这次更新本质上是一次"体验型升级"。在大模型基础能力趋于收敛的背景下,OpenAI 选择在"让回答更让人舒服"这个方向发力。幻觉减少和回答精简是最直接可感知的变化,而记忆来源功能则为长期使用建立了信任基础。

前世界第一 YouTuber PewDiePie 开源的完全自托管 AI 工作空间,免费、无追踪、自带 Agent,三天狂揽3万星。

OpenAI 给 Codex 上线 Record & Replay,录下你在 Mac 上的操作流程,自动生成可复用 Skill,是时候重新思考自动化了。

Anthropic 给 Claude Code 加上 Artifacts,开发过程实时生成可分享网页,团队协作告别人工转述。