三步把 Gemma 4 接入 OpenClaw，零 Token 成本跑本地 Agent

在 OpenClaw 里跑 Claude、GPT 这些云端模型，Token 费用是一笔持续的支出。谷歌官方最近发布了一份教程，教你分三步把 Gemma 4 本地模型接入 OpenClaw，实现零 Token 成本运行。

这篇教程把流程梳理清楚，同时说明它的适用场景和局限。

这个教程能帮你做什么

用 Gemma 4 作为 OpenClaw 的后端模型，跑在本地机器上，不花一分钱 Token 费用。适合简报生成、会议转录、定时任务等简单场景。

开始前的准备

硬件要求

Gemma 4 版本	最低显存	推荐设备
26B A4B（官方推荐）	16GB	Mac Studio M4 Pro 48GB 或同配置 PC
12B A4B	8GB	MacBook Pro M4 或 RTX 4070 以上
4B	4GB	大多数现代笔记本

所需工具

Ollama（本地模型运行环境）
OpenClaw（Agent 框架）
约 10 分钟的配置时间
零费用

具体步骤

第一步：安装 Ollama

访问 https://ollama.com/download 下载对应平台的安装包。

macOS 用户也可以用 Homebrew：

brew install ollama

安装完成后，启动 Ollama：

ollama serve

提示: 确保 Ollama 服务在后台持续运行，后续步骤依赖它。

第二步：下载 Gemma 4 模型

官方推荐 26B A4B 版本（MoE 架构，实际激活参数更少，速度快）：

ollama pull gemma4:26b-a4b

如果硬件不够，可以选择更小的版本：

ollama pull gemma4:12b-a4b
ollama pull gemma4:4b

提示: 26B A4B 版本下载约需 15-20GB 磁盘空间，确保有足够存储。

第三步：通过 Ollama 启动 OpenClaw

这一条命令会自动安装 OpenClaw 并使用 Gemma 4 作为后端启动：

ollama run gemma4:26b-a4b

然后在 OpenClaw 的配置文件中，将模型后端指向本地 Ollama 服务。具体配置方式取决于你的 OpenClaw 版本，通常在模型设置中选择「Ollama」作为 provider，填入 http://localhost:11434 作为 endpoint。

验证结果

启动后，在 OpenClaw 中发一条简单消息测试。如果收到回复，说明本地模型已经成功接入。

你可以测试几个场景来评估效果：

简报生成：给一段文本让它总结
会议转录：贴一段会议纪要让它整理
定时任务：设置一个周期性的提醒或数据汇总

适用场景与局限

适合做的事

简报、摘要、会议纪要等文本处理任务
定时执行的后台自动化任务
不需要复杂推理的日常工作流
预算有限、想先跑通流程的探索阶段

不适合做的事

复杂编程任务（和 Opus 等顶尖模型差距明显）
需要长上下文理解的任务
对安全性要求高的生产环境

注意: OpenClaw 创始人 Peter Steinberger 曾公开建议不要用廉价小模型，因为小模型更容易受到提示注入攻击。在处理敏感数据时，请自行评估风险。

成本对比

方案	月费用	适合任务复杂度
Gemma 4 本地 + OpenClaw	电费（约几元）	简单
Claude API + OpenClaw	$20-200+	中到复杂
Claude Max 订阅 + OpenClaw	$100-200	复杂

有用户算过账：如果日常只是跑简报、转录这类任务，一台 Mac Studio 3 个月就能在 Token 费用上回本。

常见问题

Q: Mac Studio M4 Pro 48GB 能跑 26B 版本吗？ A: 可以。实际显存占用约 16GB，机器还有余量。
Q: 响应速度怎么样？ A: 简单问题流畅，上下文变长或开启深度思考时会变慢。M4 Pro 上日常使用体验尚可。
Q: 和 Claude 比差多少？ A: 智力水平差距明显，尤其在工具调用、长上下文方面。但简单任务足够用。
Q: 安全吗？ A: 小模型对抗提示注入的能力较弱。如果处理敏感数据，建议使用更强的模型。

参考链接

Ollama 下载：https://ollama.com/download
Gemma 4 官方公告：https://ollama.com/library/gemma4
OpenClaw 官方文档：https://openclaw.dev

这篇教程把流程梳理清楚，同时说明它的适用场景和局限。

这个教程能帮你做什么

用 Gemma 4 作为 OpenClaw 的后端模型，跑在本地机器上，不花一分钱 Token 费用。适合简报生成、会议转录、定时任务等简单场景。

开始前的准备

硬件要求

Gemma 4 版本	最低显存	推荐设备
26B A4B（官方推荐）	16GB	Mac Studio M4 Pro 48GB 或同配置 PC
12B A4B	8GB	MacBook Pro M4 或 RTX 4070 以上
4B	4GB	大多数现代笔记本

所需工具

Ollama（本地模型运行环境）
OpenClaw（Agent 框架）
约 10 分钟的配置时间
零费用

具体步骤

第一步：安装 Ollama

访问 https://ollama.com/download 下载对应平台的安装包。

macOS 用户也可以用 Homebrew：

brew install ollama

安装完成后，启动 Ollama：

ollama serve

提示: 确保 Ollama 服务在后台持续运行，后续步骤依赖它。

第二步：下载 Gemma 4 模型

官方推荐 26B A4B 版本（MoE 架构，实际激活参数更少，速度快）：

ollama pull gemma4:26b-a4b

如果硬件不够，可以选择更小的版本：

ollama pull gemma4:12b-a4b
ollama pull gemma4:4b

提示: 26B A4B 版本下载约需 15-20GB 磁盘空间，确保有足够存储。

第三步：通过 Ollama 启动 OpenClaw

这一条命令会自动安装 OpenClaw 并使用 Gemma 4 作为后端启动：

ollama run gemma4:26b-a4b

验证结果

启动后，在 OpenClaw 中发一条简单消息测试。如果收到回复，说明本地模型已经成功接入。

你可以测试几个场景来评估效果：

简报生成：给一段文本让它总结
会议转录：贴一段会议纪要让它整理
定时任务：设置一个周期性的提醒或数据汇总

适用场景与局限

适合做的事

简报、摘要、会议纪要等文本处理任务
定时执行的后台自动化任务
不需要复杂推理的日常工作流
预算有限、想先跑通流程的探索阶段

不适合做的事

复杂编程任务（和 Opus 等顶尖模型差距明显）
需要长上下文理解的任务
对安全性要求高的生产环境

注意: OpenClaw 创始人 Peter Steinberger 曾公开建议不要用廉价小模型，因为小模型更容易受到提示注入攻击。在处理敏感数据时，请自行评估风险。

成本对比

方案	月费用	适合任务复杂度
Gemma 4 本地 + OpenClaw	电费（约几元）	简单
Claude API + OpenClaw	$20-200+	中到复杂
Claude Max 订阅 + OpenClaw	$100-200	复杂

有用户算过账：如果日常只是跑简报、转录这类任务，一台 Mac Studio 3 个月就能在 Token 费用上回本。

常见问题

Q: Mac Studio M4 Pro 48GB 能跑 26B 版本吗？ A: 可以。实际显存占用约 16GB，机器还有余量。
Q: 响应速度怎么样？ A: 简单问题流畅，上下文变长或开启深度思考时会变慢。M4 Pro 上日常使用体验尚可。
Q: 和 Claude 比差多少？ A: 智力水平差距明显，尤其在工具调用、长上下文方面。但简单任务足够用。
Q: 安全吗？ A: 小模型对抗提示注入的能力较弱。如果处理敏感数据，建议使用更强的模型。

参考链接

Ollama 下载：https://ollama.com/download
Gemma 4 官方公告：https://ollama.com/library/gemma4
OpenClaw 官方文档：https://openclaw.dev

全部

AI教程

AI产品

AI资源

三步把 Gemma 4 接入 OpenClaw，零 Token 成本跑本地 Agent

三步把 Gemma 4 接入 OpenClaw，零 Token 成本跑本地 Agent

作者

分类

相关文章

Harness工程：AI编程成功率从20%飙到100%

Hallo-Live：实时文本驱动音视频数字人

Reasonix：DeepSeek API成本砍到2折

三步把 Gemma 4 接入 OpenClaw，零 Token 成本跑本地 Agent

三步把 Gemma 4 接入 OpenClaw，零 Token 成本跑本地 Agent

作者

分类

相关文章

Harness工程：AI编程成功率从20%飙到100%

Hallo-Live：实时文本驱动音视频数字人

Reasonix：DeepSeek API成本砍到2折