toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具1,299个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

OpenAI Codex 开源模式:一行配置接入本地模型

2026/06/21
·toolin小编

Codex 新增 OSS 模式,支持 Ollama、LM Studio 等本地模型服务,实现离线运行与成本控制

OpenAI Codex 开源模式:一行配置接入本地模型
OpenAI Codex 开源模式:一行配置接入本地模型
2026/06/21

OpenAI Codex 开源模式:一行配置接入本地模型

Codex 新增 OSS 模式,支持 Ollama、LM Studio 等本地模型服务,实现离线运行与成本控制

核心变化:从"模型绑定"到"可插拔接口"两种接入方式方式一:--oss 快捷开关方式二:手动配置 model_providers现实限制:协议对不齐混合路由:省钱的关键玩法适合谁用
AI产品

OpenAI Codex 不再只认自家 GPT 模型了。通过新增的开源模式(OSS mode),你现在可以用一行配置切换到 Ollama、LM Studio 等本地模型服务,甚至实现完全离线的代码生成与推理。这对想控制 API 成本、保护代码隐私的开发者来说,是个实打实的好消息。

核心变化:从"模型绑定"到"可插拔接口"

过去,Codex 只能调用 OpenAI 自家的 GPT 模型。这次更新的本质,是 OpenAI 在 Codex 中加了一个可插拔的模型接入层——不开放模型本身,但开放了"换模型"的能力。

具体来说,开发者通过 model_providers 配置项,可以注册多个"模型提供方"。每个提供方包含四类信息:

  • 访问地址(base_url):模型服务的 URL
  • 通信协议(wire_api):目前主要支持 Responses API
  • 鉴权方式(env_key):API 密钥的环境变量名
  • 模型映射关系(model):模型名称映射

Codex 的 model_providers 配置示例

Codex 的 model_providers 配置示例。base_url 指定模型地址,wire_api 目前只认 responses 协议。

两种接入方式

方式一:--oss 快捷开关

最直接的方式是在命令行加一个 --oss 参数,Codex 就会自动连接本地模型服务。默认支持两个主流工具:

  • Ollama:本地运行大模型最流行的命令行工具
  • LM Studio:带图形界面的桌面模型管理工具

Codex --oss 连接本地模型实战

左侧 Codex CLI 用 --oss 调用本地模型,右侧 LM Studio 在本机 1234 端口加载模型对外提供服务,全程本地离线。

方式二:手动配置 model_providers

如果需要接入 DeepSeek、Mistral 等第三方模型,需要手动编辑配置文件。你可以把这些设置保存为"配置档案"(profile),调试时通过命令行快速切换。

Codex CLI 界面中的模型切换

Codex CLI 启动信息中显示当前使用的模型,一句 /model 命令即可切换。

现实限制:协议对不齐

插座装上了,不代表什么电器插上都能转。目前最大的障碍是协议兼容性:

  • Codex 主要基于 OpenAI 的 Responses API 协议
  • 大多数开源模型(如 DeepSeek)使用的是 Chat Completions 接口
  • 两套协议在请求结构、流式输出、工具调用机制上都不一致

社区的解法是在中间加一层"协议转换器"(如 LiteLLM、claude-code-router),基本流程是:

  1. Codex 按 Responses API 发出请求
  2. 路由层将其转换为 Chat Completions 格式
  3. 转发给 DeepSeek 等开源模型
  4. 返回结果再转换回 Codex 能识别的格式

目前这些协议转换方案都是社区自发的,OpenAI 官方尚未为其背书,使用时需要自行测试稳定性。

混合路由:省钱的关键玩法

更有价值的用法是混合路由:让 GPT 负责任务规划(拆解需求、设计架构),让开源模型负责执行(写代码、批量改文件)。通过这样的搭配,同样一个任务的成本可能降低一半以上,而且代码全程不出本地。

适合谁用

  • 想降低 API 成本的个人开发者
  • 需要代码隐私、不想上传云端的企业团队
  • 希望离线环境下使用 AI 编程的用户
  • 想混搭不同模型优势的技术探索者

官方文档已上线,地址:https://developers.openai.com/codex/config-advanced#oss-mode-local-providers

所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
核心变化:从"模型绑定"到"可插拔接口"两种接入方式方式一:--oss 快捷开关方式二:手动配置 model_providers现实限制:协议对不齐混合路由:省钱的关键玩法适合谁用

相关文章

GenShield:AI 生图检测+修复一体化开源框架
AI产品

GenShield:AI 生图检测+修复一体化开源框架

北大团队开源 GenShield,将 AI 生成图像检测与伪影修复统一到一个自回归框架,检测准确率达 98.8%

avatar for toolin小编
toolin小编
2天前
阿里 HappyHorse 1.1 实测:油腻感退了,1080P 还降价 25%
AI产品

阿里 HappyHorse 1.1 实测:油腻感退了,1080P 还降价 25%

阿里发布视频生成模型 HappyHorse 1.1,五大维度升级,1080P 每秒 1.2 元降为 0.9 元,附实测对比与体验地址。

avatar for toolin小编
toolin小编
1天前
百度开源 Unlimited OCR:500M 激活小模型,一口气读完 40 页不失忆
AI产品

百度开源 Unlimited OCR:500M 激活小模型,一口气读完 40 页不失忆

百度开源 Unlimited OCR,3B 总参数 / 500M 激活的端到端 OCR 模型,刷新 OmniDocBench SOTA,单次推理转录数十页文档不失忆。

avatar for toolin小编
toolin小编
1天前