MiniMax Agent 桌面端新增 Pocket 和 Computer Use 功能,支持从飞书、微信等 IM 发送指令让 Agent 操作本地软件和系统设置。


MiniMax Agent 桌面端新增 Pocket 和 Computer Use 功能,支持从飞书、微信等 IM 发送指令让 Agent 操作本地软件和系统设置。
MiniMax Agent 桌面端发布两项重要更新:Pocket 功能让你从 IM 软件远程指挥 Agent 干活,Computer Use 功能让 Agent 像人一样操作你的电脑。
Pocket 是一个可以在 IM 中调用的 Agent 入口。支持的 IM 包括飞书、微信、企业微信、Slack。
工作方式很简单:
这意味着你可以在地铁上用微信让 Agent 帮你找电脑桌面上的文件,或者在会议中用飞书让它读取文件夹里的简历并整理成文档。
Agent 可以直接看屏幕、操作鼠标和键盘,控制你电脑上的软件。包括:
"帮我看下桌面上是不是有一个 2025 report 的 pdf?找到并发给我。"
Agent 会在你电脑桌面上定位文件,找到后直接回传到 IM 对话。不需要打开电脑,不需要远程桌面。

"读取桌面上 Resume 文件夹里的所有简历,根据设计经验年限、量化成果和技能匹配度,挑选最符合 AI Native 工作环境 Product Designer 岗位的 Top 3 候选人,整理成一份飞书文档。"
![]()
这个任务跨越两个能力:Computer Use 负责读取本地简历文件,飞书 CLI 负责将结果写入飞书文档。完成后会把文档链接发回给你。

"帮我打开系统设置,把不活跃时启动屏幕保护程序设为永不。然后打开 Pocket 客户端执行每日定时任务,完成后给我一张截图。"
![]()
系统偏好设置没有公开的命令行接口,这类任务只能通过图形界面完成。Computer Use 会打开系统设置、定位到目标面板、调整选项,最后截图回传。
MiniMax 在设计 Computer Use 时采用了几个关键决策:
工具拆分而非统一操作
没有给 Agent 一个万能的"电脑"工具。而是拆成四个独立工具域:
| 工具域 | 功能 |
|---|---|
| Desktop Control | 截图、鼠标操作、键盘输入、滚动、拖拽 |
| Window Manager | 窗口列表查询、聚焦、最小化/最大化、应用启动 |
| Browser Engine | DOM 操作、CSS 选择器定位、JavaScript 执行 |
| Clipboard | 系统剪贴板读写 |
加上飞书 CLI、企业微信 CLI 等平台工具,共计 60+ 个工具。Agent 根据任务类型选择最合适的工具路径。
截图-验证-行动循环
每一步操作后立即截图,让模型确认"上一步是否真的完成了"。如果没完成,进入诊断流程尝试替代方案。这让多步任务的成功率显著提升。
权限控制
关键操作(如删除文件、修改系统设置)会在 IM 中暂停等待你的确认。即使你不在电脑前,每个关键动作也都要经过你本人的授权。
访问 agent.minimaxi.com/download 下载 MiniMax Agent 桌面端。

从 200+ 篇文章数据中提炼的好内容标准、去 AI 味检查清单,以及从 1.0 到 3.0 的 AI 内容创作进阶路径。

Lovart 的 Brand Kit 功能可以自动解析品牌手册、生成品牌字体、批量输出统一调性的视觉物料,月费 340 元起。

通过全局和项目级 CLAUDE.md 文件建立约束体系,让 Claude Code 等 Agent 工具在开发项目中保持一致的行为规范和代码质量。