
OpenAI团队用Codex Skills改造Agents SDK维护流程,通过AGENTS.md、本地技能和GitHub Actions,三个月PR合并量从316增至457,提升45%
OpenAI团队用Codex改造了Agents SDK仓库的维护方式,通过仓库本地Skills、AGENTS.md文件和GitHub Actions,把重复性工程工作变成可重复执行的工作流。
效果显著:2025年12月1日至2026年2月28日,两个仓库共合并457个PR,而此前三个月(2025年9月1日至11月30日)只有316个,提升45%。
这套配置相当简单,但效果明显。如果你维护开源项目,这套方法值得借鉴。
OpenAI Agents SDK提供Python和TypeScript两个版本,为构建智能体应用提供核心组件,也是在Realtime API之上构建语音智能体的简洁方案。
使用量级:
这种活跃度意味着大量PR、Issue和维护工作。传统方式下,重复性工程任务会消耗大量时间。

整套系统非常简洁:
AGENTS.md里.agents/skills/目录下这套配置让Codex对仓库的运作方式有了稳定的上下文,让重复性工程工作更快、更准。
技能采用渐进式披露(progressive disclosure)模型:
name和description等元数据SKILL.md的完整内容这样不会一开始就撑大智能体的上下文,同时又能携带丰富的指令、脚本和参考资料。

Python仓库是更简洁的基础版本,包含8个技能:
1. code-change-verification 当代码或构建行为发生变化时,运行必需的格式化、lint、类型检查和测试流程。
2. docs-sync 对照代码库审计文档,发现缺失、不正确或过时的文档。把源码中的docstring和注释作为生成参考文档的权威来源。
3. examples-auto-run 在自动模式下运行示例,生成日志和重试辅助文件。
4. final-release-review 将上一个发布标签与当前发布候选版本进行对比,检查发布就绪状态。
5. implementation-strategy 在修改运行时或API变更之前,先确定兼容性边界和实现方案。
6. openai-knowledge 通过官方Docs MCP工作流拉取最新的OpenAI API和平台文档。
7. pr-draft-summary 在交接时准备分支名建议、PR标题和草稿描述。
8. test-coverage-improver 运行覆盖率检查,找到最大的缺口,并提出高影响力的测试建议。
JavaScript仓库遵循同样的总体模式,针对其npm monorepo和发布流程增加了3个仓库特有的技能:
1. changeset-validation 检查变更集和版本升级级别是否真正匹配包的差异。
2. integration-tests 将包发布到本地Verdaccio(本地npm包注册中心)注册表,并验证在各支持运行时中的安装和运行行为。
3. pnpm-upgrade 协调更新pnpm工具链和CI中的版本锁定。
1. 职责明确的契约 每个技能都有清晰的触发条件和具体的输出。
2. "先报告再行动"工作流
docs-sync和test-coverage-improver是"先报告再行动"的工作流:先检查当前的差异或覆盖率产物,排出优先级,然后在编辑之前征求批准。
3. 窄范围专用技能
JavaScript专属的pnpm-upgrade技能是窄范围的:它只负责协调pnpm版本更新,不做其他事情。
4. 工作流留在仓库里 把这些工作流放在代码旁边,而不是藏在某个文档或Wiki里。
.agents/skills/.agents/skills/以PR审查为例,传统流程需要:
现在,Codex可以:
code-change-verification技能自动验证docs-sync技能检查文档test-coverage-improver技能分析覆盖率pr-draft-summary技能生成PR描述整个流程自动化,维护者只需要审核结果。
1. 申请Codex for Open Source 符合条件的开源项目维护者可以申请:
申请地址:https://openai.com/codex-for-open-source
2. 创建AGENTS.md
在仓库根目录创建AGENTS.md,写入仓库策略和工作流说明。
3. 创建.agents/skills/目录
在仓库中创建.agents/skills/目录,每个技能一个子目录。
4. 编写技能清单 每个技能包含:
SKILL.md:清单文件,描述技能的职责、触发条件和输出scripts/:可选的脚本目录references/:可选的参考资料目录assets/:可选的资源目录5. 配置GitHub Actions 使用Codex GitHub Action在CI中运行技能。
适合谁?
核心优势:
局限性:
总结: 如果你维护的开源项目有大量重复性工程任务,这套方法值得尝试。OpenAI团队用实际数据证明了效果:三个月PR合并量提升45%,而配置相当简单。
关键在于把工作流"固化"到仓库里,让AI有稳定的上下文可以依赖。

SceneMaker 是一个突破性的开源框架,能从单张图像生成完整的、带 Mesh 的 3D 场景,完美解决物体遮挡和空间位姿问题。

智谱推出 AutoClaw 本地客户端,40秒安装即用,预装 Pony-Alpha-2 模型和50+技能,彻底解决 AI Agent 部署难题

来自 Claude Code 团队工程师的一手经验,揭秘 Anthropic 内部几百个 Skills 的分类体系、编写技巧和分发策略