Peekaboo v3 让 AI Agent 能像素级截屏、读取 UI 元素、操控鼠标键盘,并打包为 MCP 服务供 Cursor 等工具直接调用。


Peekaboo v3 让 AI Agent 能像素级截屏、读取 UI 元素、操控鼠标键盘,并打包为 MCP 服务供 Cursor 等工具直接调用。
OpenClaw 的 Peekaboo 更新到 v3,给 Mac 上的 AI Agent 补上了最缺的两个能力:看屏幕和操作鼠标键盘。在此之前,Agent 能打开网页、跑流程,但涉及精确的 UI 操作就卡住了。Peekaboo v3 把这堵墙拆了。
适合在 Mac 上用 Agent 做自动化操作的开发者和效率工具爱好者。
Peekaboo(直译"躲猫猫")是一个 Mac 上的工具包,让 AI Agent 具备屏幕感知和鼠标键盘操控能力。由 OpenClaw 作者 Peter 开发,从 v3.0.0-beta 到最近的 v3.1.x 密集更新。
简单理解:给你的 Mac 装一双带眼睛的手——Agent 能看到屏幕内容,也能操作鼠标和键盘。

基本覆盖了人类用 Mac 会做的所有操作。
Peekaboo v3 支持把所有能力打包成 MCP(Model Context Protocol)服务,直接喂给你常用的 AI 工具。
实际例子:在 Cursor 里写代码,UI 出了 bug——以前要自己截屏发给 Cursor。现在 Cursor 自己就能截图、看屏幕、改代码、重新跑一遍验证,全程不需要你插手。

支持自然语言 Agent 模式,提示词可以直接用大白话描述任务,不需要写特定的命令格式。
有网友做了一个烟雾测试:让 Hermes 操作计算器、Peekaboo 读屏幕结果、Python 独立验证答案是否正确,三条链路并行协作,一次通过。

Peekaboo 是开源项目,可通过 OpenClaw 官方渠道获取。v3.1.x 系列是最近的密集更新版本。
注意: 目前仅支持 macOS。Windows 和 Linux 支持尚未确认。

Anthropic 将 Claude Code 额度翻倍并取消高峰限制,OpenAI 则将 Codex 永久免费开放,开发者迎来 AI 编程工具的黄金窗口期。

千问正式接入淘宝,用户可以在对话中完成搜索、比价、下单、支付、查物流全流程。四大场景实测 AI 购物体验。

MiniMax发布多Agent协作产品Mavis,内置Leader-Worker-Verifier分工架构,一句话完成复杂长任务。