
Agent TARS
字节开源的桌面GUI自动化AI Agent

字节开源的桌面GUI自动化AI Agent

Agent TARS (UI-TARS Desktop) 是字节跳动于 2025 年开源的多模态 AI Agent 技术栈,能通过自然语言控制计算机并执行 GUI 自动化任务。在 10+ GUI 基准测试中超越 GPT-4o 和 Claude,浏览器任务成功率达 95%,专为开发者、研究者和隐私敏感用户打造。
核心能力
适用场景 航班酒店预订自动化、GitHub issue 批量处理、应用程序配置管理、数据可视化生成。适合 AI Agent 开发者、RPA 自动化工程师、研究人员、希望自托管的技术团队,以及需要本地部署的隐私敏感企业。
独特优势 不同于需要 API 付费的 GPT-4o 和 Claude,Agent TARS 完全开源且性能更优。提供 2B、7B、72B 三种规模选择,训练自 50B tokens,在感知、推理、定位和整体 agent 能力上达到 SOTA。Apache 2.0 许可证支持商业使用,GitHub 23.5k stars 证明社区活跃。
编辑推荐 这是 2025 年最值得关注的开源 AI Agent 项目。VentureBeat 确认其超越商业巨头产品,Product Hunt 用户称赞自然语言控制体验,专业评测显示浏览器任务成功率达 95%。如果你在寻找开源、高性能且隐私友好的 GUI Agent 方案,Agent TARS 是首选。唯一提醒:项目较新(2025 年发布),长期稳定性需持续观察。
起步价:免费
无使用限制,无隐藏费用。企业可能需要承担实施和集成的相关成本。
还没有人评价这个工具