OpenAI 发布 GPT-5.5 Instant 模型,幻觉率暴降 52.5%,回答字数减少 30.2%,全量免费开放给所有 ChatGPT 用户。


OpenAI 发布 GPT-5.5 Instant 模型,幻觉率暴降 52.5%,回答字数减少 30.2%,全量免费开放给所有 ChatGPT 用户。
OpenAI 正式发布 GPT-5.5 Instant,即日起向所有 ChatGPT 用户逐步推出,取代 GPT-5.3 Instant 成为默认模型。这次更新的重点不是"更聪明",而是"更靠谱、更简洁、更像人"。

GPT-5.5 Instant 是 OpenAI 面向日常交互场景的最新模型,定位为 ChatGPT 的默认模型。它在三个方向做了针对性优化:降低幻觉率、精简回答长度、增强记忆和个性化能力。API 中的模型名称为 chat-latest。
在医学、法律、金融等专业领域的高难度对话场景中,GPT-5.5 Instant 的幻觉率(不实回答占比)比 GPT-5.3 Instant 减少了 52.5%。在用户曾标注存在事实错误的对话场景中,不实回答占比降低了 37.3%。
这意味着你拿它查资料、做翻译、写专业文档时,出错概率大幅下降。

基准测试成绩提升一览:
| 测试项目 | 提升幅度 |
|---|---|
| 科学图表推理 (CharXiv-reasoning) | +6.6% |
| 多模态专家推理 (MMMU-Pro) | +6.8% |
| 文档解析 (错误率降低) | -14.4% |
| 博士级科学问答 | +7.1% |
| 数学竞赛 (AIME 2025) | +15.8% |
GPT-5.5 Instant 的回答更加紧凑,字数减少 30.2%,行数减少 29.2%。模型会减少不必要的追问,避免随意添加表情符号,保持非正式但实用的语气。简单说:废话少了,干货多了。
模型现在能利用过往聊天记录、上传文件和 Gmail 中的上下文信息,让回答更具个性化。关键改进:

chat-latest这次更新本质上是一次"体验型升级"。在大模型基础能力趋于收敛的背景下,OpenAI 选择在"让回答更让人舒服"这个方向发力。幻觉减少和回答精简是最直接可感知的变化,而记忆来源功能则为长期使用建立了信任基础。

豆包 Seed 2.0 Lite 升级为全模态理解模型,同时支持图片、视频、音频、文本四种输入,实测前端动效复刻、视频内容理解、对话情绪识别等场景。

GitHub 2.3k星的Rust开源终端编程工具,专为DeepSeek V4优化,支持思维链输出、子Agent调度和MCP服务器

GitHub 2.3k星的DeepSeek-TUI,用Rust编写的终端编程工具,针对DeepSeek V4优化,支持100万token上下文、多子Agent并行、三种操作模式。