MiniMax Agent 桌面端新增 Pocket 和 Computer Use 功能,支持从飞书、微信等 IM 发送指令让 Agent 操作本地软件和系统设置。


MiniMax Agent 桌面端新增 Pocket 和 Computer Use 功能,支持从飞书、微信等 IM 发送指令让 Agent 操作本地软件和系统设置。
MiniMax Agent 桌面端发布两项重要更新:Pocket 功能让你从 IM 软件远程指挥 Agent 干活,Computer Use 功能让 Agent 像人一样操作你的电脑。
Pocket 是一个可以在 IM 中调用的 Agent 入口。支持的 IM 包括飞书、微信、企业微信、Slack。
工作方式很简单:
这意味着你可以在地铁上用微信让 Agent 帮你找电脑桌面上的文件,或者在会议中用飞书让它读取文件夹里的简历并整理成文档。
Agent 可以直接看屏幕、操作鼠标和键盘,控制你电脑上的软件。包括:
"帮我看下桌面上是不是有一个 2025 report 的 pdf?找到并发给我。"
Agent 会在你电脑桌面上定位文件,找到后直接回传到 IM 对话。不需要打开电脑,不需要远程桌面。

"读取桌面上 Resume 文件夹里的所有简历,根据设计经验年限、量化成果和技能匹配度,挑选最符合 AI Native 工作环境 Product Designer 岗位的 Top 3 候选人,整理成一份飞书文档。"
![]()
这个任务跨越两个能力:Computer Use 负责读取本地简历文件,飞书 CLI 负责将结果写入飞书文档。完成后会把文档链接发回给你。

"帮我打开系统设置,把不活跃时启动屏幕保护程序设为永不。然后打开 Pocket 客户端执行每日定时任务,完成后给我一张截图。"
![]()
系统偏好设置没有公开的命令行接口,这类任务只能通过图形界面完成。Computer Use 会打开系统设置、定位到目标面板、调整选项,最后截图回传。
MiniMax 在设计 Computer Use 时采用了几个关键决策:
工具拆分而非统一操作
没有给 Agent 一个万能的"电脑"工具。而是拆成四个独立工具域:
| 工具域 | 功能 |
|---|---|
| Desktop Control | 截图、鼠标操作、键盘输入、滚动、拖拽 |
| Window Manager | 窗口列表查询、聚焦、最小化/最大化、应用启动 |
| Browser Engine | DOM 操作、CSS 选择器定位、JavaScript 执行 |
| Clipboard | 系统剪贴板读写 |
加上飞书 CLI、企业微信 CLI 等平台工具,共计 60+ 个工具。Agent 根据任务类型选择最合适的工具路径。
截图-验证-行动循环
每一步操作后立即截图,让模型确认"上一步是否真的完成了"。如果没完成,进入诊断流程尝试替代方案。这让多步任务的成功率显著提升。
权限控制
关键操作(如删除文件、修改系统设置)会在 IM 中暂停等待你的确认。即使你不在电脑前,每个关键动作也都要经过你本人的授权。
访问 agent.minimaxi.com/download 下载 MiniMax Agent 桌面端。

全球AI Lab排名第9的Agnes AI宣布无限期免费开放文本、图片、视频三款核心模型API,开发者零成本调用全模态能力

Coze 3.0 支持接入本地Claude Code、Codex等AI Agent到同一个项目中协作,手机上也能远程指挥AI团队写代码、做视频

MiniMax M3 搭载全新稀疏注意力架构MSA,支持1M上下文窗口,Coding能力超过GPT-5.5,国内首个齐备前沿三大能力的模型