Codex 新增 OSS 模式,支持 Ollama、LM Studio 等本地模型服务,实现离线运行与成本控制


Codex 新增 OSS 模式,支持 Ollama、LM Studio 等本地模型服务,实现离线运行与成本控制
OpenAI Codex 不再只认自家 GPT 模型了。通过新增的开源模式(OSS mode),你现在可以用一行配置切换到 Ollama、LM Studio 等本地模型服务,甚至实现完全离线的代码生成与推理。这对想控制 API 成本、保护代码隐私的开发者来说,是个实打实的好消息。
过去,Codex 只能调用 OpenAI 自家的 GPT 模型。这次更新的本质,是 OpenAI 在 Codex 中加了一个可插拔的模型接入层——不开放模型本身,但开放了"换模型"的能力。
具体来说,开发者通过 model_providers 配置项,可以注册多个"模型提供方"。每个提供方包含四类信息:

Codex 的 model_providers 配置示例。base_url 指定模型地址,wire_api 目前只认 responses 协议。
最直接的方式是在命令行加一个 --oss 参数,Codex 就会自动连接本地模型服务。默认支持两个主流工具:

左侧 Codex CLI 用 --oss 调用本地模型,右侧 LM Studio 在本机 1234 端口加载模型对外提供服务,全程本地离线。
如果需要接入 DeepSeek、Mistral 等第三方模型,需要手动编辑配置文件。你可以把这些设置保存为"配置档案"(profile),调试时通过命令行快速切换。

Codex CLI 启动信息中显示当前使用的模型,一句 /model 命令即可切换。
插座装上了,不代表什么电器插上都能转。目前最大的障碍是协议兼容性:
社区的解法是在中间加一层"协议转换器"(如 LiteLLM、claude-code-router),基本流程是:
目前这些协议转换方案都是社区自发的,OpenAI 官方尚未为其背书,使用时需要自行测试稳定性。
更有价值的用法是混合路由:让 GPT 负责任务规划(拆解需求、设计架构),让开源模型负责执行(写代码、批量改文件)。通过这样的搭配,同样一个任务的成本可能降低一半以上,而且代码全程不出本地。
官方文档已上线,地址:https://developers.openai.com/codex/config-advanced#oss-mode-local-providers

北大团队开源 GenShield,将 AI 生成图像检测与伪影修复统一到一个自回归框架,检测准确率达 98.8%

阿里发布视频生成模型 HappyHorse 1.1,五大维度升级,1080P 每秒 1.2 元降为 0.9 元,附实测对比与体验地址。

百度开源 Unlimited OCR,3B 总参数 / 500M 激活的端到端 OCR 模型,刷新 OmniDocBench SOTA,单次推理转录数十页文档不失忆。